d0234cd58a4d2ec11af9d3b6c24151c798af57b3
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, 2006, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     dVAR;
181     void *new_chunk;
182     U32 new_chunk_size;
183     LOCK_SV_MUTEX;
184     new_chunk = (void *)(chunk);
185     new_chunk_size = (chunk_size);
186     if (new_chunk_size > PL_nice_chunk_size) {
187         Safefree(PL_nice_chunk);
188         PL_nice_chunk = (char *) new_chunk;
189         PL_nice_chunk_size = new_chunk_size;
190     } else {
191         Safefree(chunk);
192     }
193     UNLOCK_SV_MUTEX;
194 }
195
196 #ifdef DEBUG_LEAKING_SCALARS
197 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
198 #else
199 #  define FREE_SV_DEBUG_FILE(sv)
200 #endif
201
202 #ifdef PERL_POISON
203 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
204 /* Whilst I'd love to do this, it seems that things like to check on
205    unreferenced scalars
206 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
207 */
208 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
209                                 Poison(&SvREFCNT(sv), 1, U32)
210 #else
211 #  define SvARENA_CHAIN(sv)     SvANY(sv)
212 #  define POSION_SV_HEAD(sv)
213 #endif
214
215 #define plant_SV(p) \
216     STMT_START {                                        \
217         FREE_SV_DEBUG_FILE(p);                          \
218         POSION_SV_HEAD(p);                              \
219         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
220         SvFLAGS(p) = SVTYPEMASK;                        \
221         PL_sv_root = (p);                               \
222         --PL_sv_count;                                  \
223     } STMT_END
224
225 /* sv_mutex must be held while calling uproot_SV() */
226 #define uproot_SV(p) \
227     STMT_START {                                        \
228         (p) = PL_sv_root;                               \
229         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
230         ++PL_sv_count;                                  \
231     } STMT_END
232
233
234 /* make some more SVs by adding another arena */
235
236 /* sv_mutex must be held while calling more_sv() */
237 STATIC SV*
238 S_more_sv(pTHX)
239 {
240     dVAR;
241     SV* sv;
242
243     if (PL_nice_chunk) {
244         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
245         PL_nice_chunk = Nullch;
246         PL_nice_chunk_size = 0;
247     }
248     else {
249         char *chunk;                /* must use New here to match call to */
250         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
251         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
252     }
253     uproot_SV(sv);
254     return sv;
255 }
256
257 /* new_SV(): return a new, empty SV head */
258
259 #ifdef DEBUG_LEAKING_SCALARS
260 /* provide a real function for a debugger to play with */
261 STATIC SV*
262 S_new_SV(pTHX)
263 {
264     SV* sv;
265
266     LOCK_SV_MUTEX;
267     if (PL_sv_root)
268         uproot_SV(sv);
269     else
270         sv = S_more_sv(aTHX);
271     UNLOCK_SV_MUTEX;
272     SvANY(sv) = 0;
273     SvREFCNT(sv) = 1;
274     SvFLAGS(sv) = 0;
275     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
276     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
277         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
278     sv->sv_debug_inpad = 0;
279     sv->sv_debug_cloned = 0;
280     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
281     
282     return sv;
283 }
284 #  define new_SV(p) (p)=S_new_SV(aTHX)
285
286 #else
287 #  define new_SV(p) \
288     STMT_START {                                        \
289         LOCK_SV_MUTEX;                                  \
290         if (PL_sv_root)                                 \
291             uproot_SV(p);                               \
292         else                                            \
293             (p) = S_more_sv(aTHX);                      \
294         UNLOCK_SV_MUTEX;                                \
295         SvANY(p) = 0;                                   \
296         SvREFCNT(p) = 1;                                \
297         SvFLAGS(p) = 0;                                 \
298     } STMT_END
299 #endif
300
301
302 /* del_SV(): return an empty SV head to the free list */
303
304 #ifdef DEBUGGING
305
306 #define del_SV(p) \
307     STMT_START {                                        \
308         LOCK_SV_MUTEX;                                  \
309         if (DEBUG_D_TEST)                               \
310             del_sv(p);                                  \
311         else                                            \
312             plant_SV(p);                                \
313         UNLOCK_SV_MUTEX;                                \
314     } STMT_END
315
316 STATIC void
317 S_del_sv(pTHX_ SV *p)
318 {
319     dVAR;
320     if (DEBUG_D_TEST) {
321         SV* sva;
322         bool ok = 0;
323         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
324             const SV * const sv = sva + 1;
325             const SV * const svend = &sva[SvREFCNT(sva)];
326             if (p >= sv && p < svend) {
327                 ok = 1;
328                 break;
329             }
330         }
331         if (!ok) {
332             if (ckWARN_d(WARN_INTERNAL))        
333                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
334                             "Attempt to free non-arena SV: 0x%"UVxf
335                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
336             return;
337         }
338     }
339     plant_SV(p);
340 }
341
342 #else /* ! DEBUGGING */
343
344 #define del_SV(p)   plant_SV(p)
345
346 #endif /* DEBUGGING */
347
348
349 /*
350 =head1 SV Manipulation Functions
351
352 =for apidoc sv_add_arena
353
354 Given a chunk of memory, link it to the head of the list of arenas,
355 and split it into a list of free SVs.
356
357 =cut
358 */
359
360 void
361 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
362 {
363     dVAR;
364     SV* const sva = (SV*)ptr;
365     register SV* sv;
366     register SV* svend;
367
368     /* The first SV in an arena isn't an SV. */
369     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
370     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
371     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
372
373     PL_sv_arenaroot = sva;
374     PL_sv_root = sva + 1;
375
376     svend = &sva[SvREFCNT(sva) - 1];
377     sv = sva + 1;
378     while (sv < svend) {
379         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
380 #ifdef DEBUGGING
381         SvREFCNT(sv) = 0;
382 #endif
383         /* Must always set typemask because it's awlays checked in on cleanup
384            when the arenas are walked looking for objects.  */
385         SvFLAGS(sv) = SVTYPEMASK;
386         sv++;
387     }
388     SvARENA_CHAIN(sv) = 0;
389 #ifdef DEBUGGING
390     SvREFCNT(sv) = 0;
391 #endif
392     SvFLAGS(sv) = SVTYPEMASK;
393 }
394
395 /* visit(): call the named function for each non-free SV in the arenas
396  * whose flags field matches the flags/mask args. */
397
398 STATIC I32
399 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
400 {
401     dVAR;
402     SV* sva;
403     I32 visited = 0;
404
405     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
406         register const SV * const svend = &sva[SvREFCNT(sva)];
407         register SV* sv;
408         for (sv = sva + 1; sv < svend; ++sv) {
409             if (SvTYPE(sv) != SVTYPEMASK
410                     && (sv->sv_flags & mask) == flags
411                     && SvREFCNT(sv))
412             {
413                 (FCALL)(aTHX_ sv);
414                 ++visited;
415             }
416         }
417     }
418     return visited;
419 }
420
421 #ifdef DEBUGGING
422
423 /* called by sv_report_used() for each live SV */
424
425 static void
426 do_report_used(pTHX_ SV *sv)
427 {
428     if (SvTYPE(sv) != SVTYPEMASK) {
429         PerlIO_printf(Perl_debug_log, "****\n");
430         sv_dump(sv);
431     }
432 }
433 #endif
434
435 /*
436 =for apidoc sv_report_used
437
438 Dump the contents of all SVs not yet freed. (Debugging aid).
439
440 =cut
441 */
442
443 void
444 Perl_sv_report_used(pTHX)
445 {
446 #ifdef DEBUGGING
447     visit(do_report_used, 0, 0);
448 #endif
449 }
450
451 /* called by sv_clean_objs() for each live SV */
452
453 static void
454 do_clean_objs(pTHX_ SV *ref)
455 {
456     dVAR;
457     if (SvROK(ref)) {
458         SV * const target = SvRV(ref);
459         if (SvOBJECT(target)) {
460             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
461             if (SvWEAKREF(ref)) {
462                 sv_del_backref(target, ref);
463                 SvWEAKREF_off(ref);
464                 SvRV_set(ref, NULL);
465             } else {
466                 SvROK_off(ref);
467                 SvRV_set(ref, NULL);
468                 SvREFCNT_dec(target);
469             }
470         }
471     }
472
473     /* XXX Might want to check arrays, etc. */
474 }
475
476 /* called by sv_clean_objs() for each live SV */
477
478 #ifndef DISABLE_DESTRUCTOR_KLUDGE
479 static void
480 do_clean_named_objs(pTHX_ SV *sv)
481 {
482     dVAR;
483     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
484         if ((
485 #ifdef PERL_DONT_CREATE_GVSV
486              GvSV(sv) &&
487 #endif
488              SvOBJECT(GvSV(sv))) ||
489              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
490              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
491              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
492              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
493         {
494             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
495             SvFLAGS(sv) |= SVf_BREAK;
496             SvREFCNT_dec(sv);
497         }
498     }
499 }
500 #endif
501
502 /*
503 =for apidoc sv_clean_objs
504
505 Attempt to destroy all objects not yet freed
506
507 =cut
508 */
509
510 void
511 Perl_sv_clean_objs(pTHX)
512 {
513     dVAR;
514     PL_in_clean_objs = TRUE;
515     visit(do_clean_objs, SVf_ROK, SVf_ROK);
516 #ifndef DISABLE_DESTRUCTOR_KLUDGE
517     /* some barnacles may yet remain, clinging to typeglobs */
518     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
519 #endif
520     PL_in_clean_objs = FALSE;
521 }
522
523 /* called by sv_clean_all() for each live SV */
524
525 static void
526 do_clean_all(pTHX_ SV *sv)
527 {
528     dVAR;
529     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
530     SvFLAGS(sv) |= SVf_BREAK;
531     if (PL_comppad == (AV*)sv) {
532         PL_comppad = NULL;
533         PL_curpad = Null(SV**);
534     }
535     SvREFCNT_dec(sv);
536 }
537
538 /*
539 =for apidoc sv_clean_all
540
541 Decrement the refcnt of each remaining SV, possibly triggering a
542 cleanup. This function may have to be called multiple times to free
543 SVs which are in complex self-referential hierarchies.
544
545 =cut
546 */
547
548 I32
549 Perl_sv_clean_all(pTHX)
550 {
551     dVAR;
552     I32 cleaned;
553     PL_in_clean_all = TRUE;
554     cleaned = visit(do_clean_all, 0,0);
555     PL_in_clean_all = FALSE;
556     return cleaned;
557 }
558
559 static void 
560 S_free_arena(pTHX_ void **root) {
561     while (root) {
562         void ** const next = *(void **)root;
563         Safefree(root);
564         root = next;
565     }
566 }
567     
568 /*
569 =for apidoc sv_free_arenas
570
571 Deallocate the memory used by all arenas. Note that all the individual SV
572 heads and bodies within the arenas must already have been freed.
573
574 =cut
575 */
576 #define free_arena(name)                                        \
577     STMT_START {                                                \
578         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
579         PL_ ## name ## _arenaroot = 0;                          \
580         PL_ ## name ## _root = 0;                               \
581     } STMT_END
582
583 void
584 Perl_sv_free_arenas(pTHX)
585 {
586     dVAR;
587     SV* sva;
588     SV* svanext;
589     int i;
590
591     /* Free arenas here, but be careful about fake ones.  (We assume
592        contiguity of the fake ones with the corresponding real ones.) */
593
594     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
595         svanext = (SV*) SvANY(sva);
596         while (svanext && SvFAKE(svanext))
597             svanext = (SV*) SvANY(svanext);
598
599         if (!SvFAKE(sva))
600             Safefree(sva);
601     }
602
603     for (i=0; i<SVt_LAST; i++) {
604         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
605         PL_body_arenaroots[i] = 0;
606         PL_body_roots[i] = 0;
607     }
608
609     Safefree(PL_nice_chunk);
610     PL_nice_chunk = Nullch;
611     PL_nice_chunk_size = 0;
612     PL_sv_arenaroot = 0;
613     PL_sv_root = 0;
614 }
615
616 /*
617   Here are mid-level routines that manage the allocation of bodies out
618   of the various arenas.  There are 5 kinds of arenas:
619
620   1. SV-head arenas, which are discussed and handled above
621   2. regular body arenas
622   3. arenas for reduced-size bodies
623   4. Hash-Entry arenas
624   5. pte arenas (thread related)
625
626   Arena types 2 & 3 are chained by body-type off an array of
627   arena-root pointers, which is indexed by svtype.  Some of the
628   larger/less used body types are malloced singly, since a large
629   unused block of them is wasteful.  Also, several svtypes dont have
630   bodies; the data fits into the sv-head itself.  The arena-root
631   pointer thus has a few unused root-pointers (which may be hijacked
632   later for arena types 4,5)
633
634   3 differs from 2 as an optimization; some body types have several
635   unused fields in the front of the structure (which are kept in-place
636   for consistency).  These bodies can be allocated in smaller chunks,
637   because the leading fields arent accessed.  Pointers to such bodies
638   are decremented to point at the unused 'ghost' memory, knowing that
639   the pointers are used with offsets to the real memory.
640
641   HE, HEK arenas are managed separately, with separate code, but may
642   be merge-able later..
643
644   PTE arenas are not sv-bodies, but they share these mid-level
645   mechanics, so are considered here.  The new mid-level mechanics rely
646   on the sv_type of the body being allocated, so we just reserve one
647   of the unused body-slots for PTEs, then use it in those (2) PTE
648   contexts below (line ~10k)
649 */
650
651 STATIC void *
652 S_more_bodies (pTHX_ size_t size, svtype sv_type)
653 {
654     dVAR;
655     void ** const arena_root    = &PL_body_arenaroots[sv_type];
656     void ** const root          = &PL_body_roots[sv_type];
657     char *start;
658     const char *end;
659     const size_t count = PERL_ARENA_SIZE / size;
660
661     Newx(start, count*size, char);
662     *((void **) start) = *arena_root;
663     *arena_root = (void *)start;
664
665     end = start + (count-1) * size;
666
667     /* The initial slot is used to link the arenas together, so it isn't to be
668        linked into the list of ready-to-use bodies.  */
669
670     start += size;
671
672     *root = (void *)start;
673
674     while (start < end) {
675         char * const next = start + size;
676         *(void**) start = (void *)next;
677         start = next;
678     }
679     *(void **)start = 0;
680
681     return *root;
682 }
683
684 /* grab a new thing from the free list, allocating more if necessary */
685
686 /* 1st, the inline version  */
687
688 #define new_body_inline(xpv, size, sv_type) \
689     STMT_START { \
690         void ** const r3wt = &PL_body_roots[sv_type]; \
691         LOCK_SV_MUTEX; \
692         xpv = *((void **)(r3wt)) \
693           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
694         *(r3wt) = *(void**)(xpv); \
695         UNLOCK_SV_MUTEX; \
696     } STMT_END
697
698 /* now use the inline version in the proper function */
699
700 #ifndef PURIFY
701
702 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
703    compilers issue warnings.  */
704
705 STATIC void *
706 S_new_body(pTHX_ size_t size, svtype sv_type)
707 {
708     dVAR;
709     void *xpv;
710     new_body_inline(xpv, size, sv_type);
711     return xpv;
712 }
713
714 #endif
715
716 /* return a thing to the free list */
717
718 #define del_body(thing, root)                   \
719     STMT_START {                                \
720         void ** const thing_copy = (void **)thing;\
721         LOCK_SV_MUTEX;                          \
722         *thing_copy = *root;                    \
723         *root = (void*)thing_copy;              \
724         UNLOCK_SV_MUTEX;                        \
725     } STMT_END
726
727 /* 
728    Revisiting type 3 arenas, there are 4 body-types which have some
729    members that are never accessed.  They are XPV, XPVIV, XPVAV,
730    XPVHV, which have corresponding types: xpv_allocated,
731    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
732
733    For these types, the arenas are carved up into *_allocated size
734    chunks, we thus avoid wasted memory for those unaccessed members.
735    When bodies are allocated, we adjust the pointer back in memory by
736    the size of the bit not allocated, so it's as if we allocated the
737    full structure.  (But things will all go boom if you write to the
738    part that is "not there", because you'll be overwriting the last
739    members of the preceding structure in memory.)
740
741    We calculate the correction using the STRUCT_OFFSET macro. For example, if
742    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
743    and the pointer is unchanged. If the allocated structure is smaller (no
744    initial NV actually allocated) then the net effect is to subtract the size
745    of the NV from the pointer, to return a new pointer as if an initial NV were
746    actually allocated.
747
748    This is the same trick as was used for NV and IV bodies. Ironically it
749    doesn't need to be used for NV bodies any more, because NV is now at the
750    start of the structure. IV bodies don't need it either, because they are
751    no longer allocated.  */
752
753 /* The following 2 arrays hide the above details in a pair of
754    lookup-tables, allowing us to be body-type agnostic.
755
756    size maps svtype to its body's allocated size.
757    offset maps svtype to the body-pointer adjustment needed
758
759    NB: elements in latter are 0 or <0, and are added during
760    allocation, and subtracted during deallocation.  It may be clearer
761    to invert the values, and call it shrinkage_by_svtype.
762 */
763
764 struct body_details {
765     size_t size;        /* Size to allocate  */
766     size_t copy;        /* Size of structure to copy (may be shorter)  */
767     size_t offset;
768     bool cant_upgrade;  /* Can upgrade this type */
769     bool zero_nv;       /* zero the NV when upgrading from this */
770     bool arena;         /* Allocated from an arena */
771 };
772
773 #define HADNV FALSE
774 #define NONV TRUE
775
776 #ifdef PURIFY
777 /* With -DPURFIY we allocate everything directly, and don't use arenas.
778    This seems a rather elegant way to simplify some of the code below.  */
779 #define HASARENA FALSE
780 #else
781 #define HASARENA TRUE
782 #endif
783 #define NOARENA FALSE
784
785 /* A macro to work out the offset needed to subtract from a pointer to (say)
786
787 typedef struct {
788     STRLEN      xpv_cur;
789     STRLEN      xpv_len;
790 } xpv_allocated;
791
792 to make its members accessible via a pointer to (say)
793
794 struct xpv {
795     NV          xnv_nv;
796     STRLEN      xpv_cur;
797     STRLEN      xpv_len;
798 };
799
800 */
801
802 #define relative_STRUCT_OFFSET(longer, shorter, member) \
803     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
804
805 /* Calculate the length to copy. Specifically work out the length less any
806    final padding the compiler needed to add.  See the comment in sv_upgrade
807    for why copying the padding proved to be a bug.  */
808
809 #define copy_length(type, last_member) \
810         STRUCT_OFFSET(type, last_member) \
811         + sizeof (((type*)SvANY((SV*)0))->last_member)
812
813 static const struct body_details bodies_by_type[] = {
814     {0, 0, 0, FALSE, NONV, NOARENA},
815     /* IVs are in the head, so the allocation size is 0  */
816     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
817     /* 8 bytes on most ILP32 with IEEE doubles */
818     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
819     /* RVs are in the head now */
820     /* However, this slot is overloaded and used by the pte  */
821     {0, 0, 0, FALSE, NONV, NOARENA},
822     /* 8 bytes on most ILP32 with IEEE doubles */
823     {sizeof(xpv_allocated),
824      copy_length(XPV, xpv_len)
825      - relative_STRUCT_OFFSET(xpv_allocated, XPV, xpv_cur),
826      + relative_STRUCT_OFFSET(xpv_allocated, XPV, xpv_cur),
827      FALSE, NONV, HASARENA},
828     /* 12 */
829     {sizeof(xpviv_allocated),
830      copy_length(XPVIV, xiv_u)
831      - relative_STRUCT_OFFSET(xpviv_allocated, XPVIV, xpv_cur),
832      + relative_STRUCT_OFFSET(xpviv_allocated, XPVIV, xpv_cur),
833      FALSE, NONV, HASARENA},
834     /* 20 */
835     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
836     /* 28 */
837     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
838     /* 36 */
839     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
840     /* 48 */
841     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
842     /* 64 */
843     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
844     /* 20 */
845     {sizeof(xpvav_allocated),
846      copy_length(XPVAV, xmg_stash)
847      - relative_STRUCT_OFFSET(xpvav_allocated, XPVAV, xav_fill),
848      + relative_STRUCT_OFFSET(xpvav_allocated, XPVAV, xav_fill),
849      TRUE, HADNV, HASARENA},
850     /* 20 */
851     {sizeof(xpvhv_allocated),
852      copy_length(XPVHV, xmg_stash)
853      - relative_STRUCT_OFFSET(xpvhv_allocated, XPVHV, xhv_fill),
854      + relative_STRUCT_OFFSET(xpvhv_allocated, XPVHV, xhv_fill),
855      TRUE, HADNV, HASARENA},
856     /* 76 */
857     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
858     /* 80 */
859     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
860     /* 84 */
861     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
862 };
863
864 #define new_body_type(sv_type)                  \
865     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
866              - bodies_by_type[sv_type].offset)
867
868 #define del_body_type(p, sv_type)       \
869     del_body(p, &PL_body_roots[sv_type])
870
871
872 #define new_body_allocated(sv_type)             \
873     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
874              - bodies_by_type[sv_type].offset)
875
876 #define del_body_allocated(p, sv_type)          \
877     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
878
879
880 #define my_safemalloc(s)        (void*)safemalloc(s)
881 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
882 #define my_safefree(p)  safefree((char*)p)
883
884 #ifdef PURIFY
885
886 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
887 #define del_XNV(p)      my_safefree(p)
888
889 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
890 #define del_XPVNV(p)    my_safefree(p)
891
892 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
893 #define del_XPVAV(p)    my_safefree(p)
894
895 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
896 #define del_XPVHV(p)    my_safefree(p)
897
898 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
899 #define del_XPVMG(p)    my_safefree(p)
900
901 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
902 #define del_XPVGV(p)    my_safefree(p)
903
904 #else /* !PURIFY */
905
906 #define new_XNV()       new_body_type(SVt_NV)
907 #define del_XNV(p)      del_body_type(p, SVt_NV)
908
909 #define new_XPVNV()     new_body_type(SVt_PVNV)
910 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
911
912 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
913 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
914
915 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
916 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
917
918 #define new_XPVMG()     new_body_type(SVt_PVMG)
919 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
920
921 #define new_XPVGV()     new_body_type(SVt_PVGV)
922 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
923
924 #endif /* PURIFY */
925
926 /* no arena for you! */
927
928 #define new_NOARENA(details) \
929         my_safemalloc((details)->size + (details)->offset)
930 #define new_NOARENAZ(details) \
931         my_safecalloc((details)->size + (details)->offset)
932
933 /*
934 =for apidoc sv_upgrade
935
936 Upgrade an SV to a more complex form.  Generally adds a new body type to the
937 SV, then copies across as much information as possible from the old body.
938 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
939
940 =cut
941 */
942
943 void
944 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
945 {
946     dVAR;
947     void*       old_body;
948     void*       new_body;
949     const U32   old_type = SvTYPE(sv);
950     const struct body_details *const old_type_details
951         = bodies_by_type + old_type;
952     const struct body_details *new_type_details = bodies_by_type + new_type;
953
954     if (new_type != SVt_PV && SvIsCOW(sv)) {
955         sv_force_normal_flags(sv, 0);
956     }
957
958     if (old_type == new_type)
959         return;
960
961     if (old_type > new_type)
962         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
963                 (int)old_type, (int)new_type);
964
965
966     old_body = SvANY(sv);
967
968     /* Copying structures onto other structures that have been neatly zeroed
969        has a subtle gotcha. Consider XPVMG
970
971        +------+------+------+------+------+-------+-------+
972        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
973        +------+------+------+------+------+-------+-------+
974        0      4      8     12     16     20      24      28
975
976        where NVs are aligned to 8 bytes, so that sizeof that structure is
977        actually 32 bytes long, with 4 bytes of padding at the end:
978
979        +------+------+------+------+------+-------+-------+------+
980        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
981        +------+------+------+------+------+-------+-------+------+
982        0      4      8     12     16     20      24      28     32
983
984        so what happens if you allocate memory for this structure:
985
986        +------+------+------+------+------+-------+-------+------+------+...
987        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
988        +------+------+------+------+------+-------+-------+------+------+...
989        0      4      8     12     16     20      24      28     32     36
990
991        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
992        expect, because you copy the area marked ??? onto GP. Now, ??? may have
993        started out as zero once, but it's quite possible that it isn't. So now,
994        rather than a nicely zeroed GP, you have it pointing somewhere random.
995        Bugs ensue.
996
997        (In fact, GP ends up pointing at a previous GP structure, because the
998        principle cause of the padding in XPVMG getting garbage is a copy of
999        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
1000
1001        So we are careful and work out the size of used parts of all the
1002        structures.  */
1003
1004     switch (old_type) {
1005     case SVt_NULL:
1006         break;
1007     case SVt_IV:
1008         if (new_type < SVt_PVIV) {
1009             new_type = (new_type == SVt_NV)
1010                 ? SVt_PVNV : SVt_PVIV;
1011             new_type_details = bodies_by_type + new_type;
1012         }
1013         break;
1014     case SVt_NV:
1015         if (new_type < SVt_PVNV) {
1016             new_type = SVt_PVNV;
1017             new_type_details = bodies_by_type + new_type;
1018         }
1019         break;
1020     case SVt_RV:
1021         break;
1022     case SVt_PV:
1023         assert(new_type > SVt_PV);
1024         assert(SVt_IV < SVt_PV);
1025         assert(SVt_NV < SVt_PV);
1026         break;
1027     case SVt_PVIV:
1028         break;
1029     case SVt_PVNV:
1030         break;
1031     case SVt_PVMG:
1032         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1033            there's no way that it can be safely upgraded, because perl.c
1034            expects to Safefree(SvANY(PL_mess_sv))  */
1035         assert(sv != PL_mess_sv);
1036         /* This flag bit is used to mean other things in other scalar types.
1037            Given that it only has meaning inside the pad, it shouldn't be set
1038            on anything that can get upgraded.  */
1039         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1040         break;
1041     default:
1042         if (old_type_details->cant_upgrade)
1043             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1044     }
1045
1046     SvFLAGS(sv) &= ~SVTYPEMASK;
1047     SvFLAGS(sv) |= new_type;
1048
1049     switch (new_type) {
1050     case SVt_NULL:
1051         Perl_croak(aTHX_ "Can't upgrade to undef");
1052     case SVt_IV:
1053         assert(old_type == SVt_NULL);
1054         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1055         SvIV_set(sv, 0);
1056         return;
1057     case SVt_NV:
1058         assert(old_type == SVt_NULL);
1059         SvANY(sv) = new_XNV();
1060         SvNV_set(sv, 0);
1061         return;
1062     case SVt_RV:
1063         assert(old_type == SVt_NULL);
1064         SvANY(sv) = &sv->sv_u.svu_rv;
1065         SvRV_set(sv, 0);
1066         return;
1067     case SVt_PVHV:
1068         SvANY(sv) = new_XPVHV();
1069         HvFILL(sv)      = 0;
1070         HvMAX(sv)       = 0;
1071         HvTOTALKEYS(sv) = 0;
1072
1073         goto hv_av_common;
1074
1075     case SVt_PVAV:
1076         SvANY(sv) = new_XPVAV();
1077         AvMAX(sv)       = -1;
1078         AvFILLp(sv)     = -1;
1079         AvALLOC(sv)     = 0;
1080         AvREAL_only(sv);
1081
1082     hv_av_common:
1083         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1084            The target created by newSVrv also is, and it can have magic.
1085            However, it never has SvPVX set.
1086         */
1087         if (old_type >= SVt_RV) {
1088             assert(SvPVX_const(sv) == 0);
1089         }
1090
1091         /* Could put this in the else clause below, as PVMG must have SvPVX
1092            0 already (the assertion above)  */
1093         SvPV_set(sv, (char*)0);
1094
1095         if (old_type >= SVt_PVMG) {
1096             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1097             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1098         } else {
1099             SvMAGIC_set(sv, 0);
1100             SvSTASH_set(sv, 0);
1101         }
1102         break;
1103
1104
1105     case SVt_PVIV:
1106         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1107            no route from NV to PVIV, NOK can never be true  */
1108         assert(!SvNOKp(sv));
1109         assert(!SvNOK(sv));
1110     case SVt_PVIO:
1111     case SVt_PVFM:
1112     case SVt_PVBM:
1113     case SVt_PVGV:
1114     case SVt_PVCV:
1115     case SVt_PVLV:
1116     case SVt_PVMG:
1117     case SVt_PVNV:
1118     case SVt_PV:
1119
1120         assert(new_type_details->size);
1121         /* We always allocated the full length item with PURIFY. To do this
1122            we fake things so that arena is false for all 16 types..  */
1123         if(new_type_details->arena) {
1124             /* This points to the start of the allocated area.  */
1125             new_body_inline(new_body, new_type_details->size, new_type);
1126             Zero(new_body, new_type_details->size, char);
1127             new_body = ((char *)new_body) - new_type_details->offset;
1128         } else {
1129             new_body = new_NOARENAZ(new_type_details);
1130         }
1131         SvANY(sv) = new_body;
1132
1133         if (old_type_details->copy) {
1134             Copy((char *)old_body + old_type_details->offset,
1135                  (char *)new_body + old_type_details->offset,
1136                  old_type_details->copy, char);
1137         }
1138
1139 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1140         /* If NV 0.0 is stores as all bits 0 then Zero() already creates a
1141          * correct 0.0 for us.  Otherwise, if the old body didn't have an
1142          * NV slot, but the new one does, then we need to initialise the
1143          * freshly created NV slot with whatever the correct bit pattern is
1144          * for 0.0  */
1145         if (old_type_details->zero_nv && !new_type_details->zero_nv)
1146             SvNV_set(sv, 0);
1147 #endif
1148
1149         if (new_type == SVt_PVIO)
1150             IoPAGE_LEN(sv) = 60;
1151         if (old_type < SVt_RV)
1152             SvPV_set(sv, 0);
1153         break;
1154     default:
1155         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1156     }
1157
1158     if (old_type_details->size) {
1159         /* If the old body had an allocated size, then we need to free it.  */
1160 #ifdef PURIFY
1161         my_safefree(old_body);
1162 #else
1163         del_body((void*)((char*)old_body + old_type_details->offset),
1164                  &PL_body_roots[old_type]);
1165 #endif
1166     }
1167 }
1168
1169 /*
1170 =for apidoc sv_backoff
1171
1172 Remove any string offset. You should normally use the C<SvOOK_off> macro
1173 wrapper instead.
1174
1175 =cut
1176 */
1177
1178 int
1179 Perl_sv_backoff(pTHX_ register SV *sv)
1180 {
1181     assert(SvOOK(sv));
1182     assert(SvTYPE(sv) != SVt_PVHV);
1183     assert(SvTYPE(sv) != SVt_PVAV);
1184     if (SvIVX(sv)) {
1185         const char * const s = SvPVX_const(sv);
1186         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1187         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1188         SvIV_set(sv, 0);
1189         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1190     }
1191     SvFLAGS(sv) &= ~SVf_OOK;
1192     return 0;
1193 }
1194
1195 /*
1196 =for apidoc sv_grow
1197
1198 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1199 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1200 Use the C<SvGROW> wrapper instead.
1201
1202 =cut
1203 */
1204
1205 char *
1206 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1207 {
1208     register char *s;
1209
1210 #ifdef HAS_64K_LIMIT
1211     if (newlen >= 0x10000) {
1212         PerlIO_printf(Perl_debug_log,
1213                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1214         my_exit(1);
1215     }
1216 #endif /* HAS_64K_LIMIT */
1217     if (SvROK(sv))
1218         sv_unref(sv);
1219     if (SvTYPE(sv) < SVt_PV) {
1220         sv_upgrade(sv, SVt_PV);
1221         s = SvPVX_mutable(sv);
1222     }
1223     else if (SvOOK(sv)) {       /* pv is offset? */
1224         sv_backoff(sv);
1225         s = SvPVX_mutable(sv);
1226         if (newlen > SvLEN(sv))
1227             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1228 #ifdef HAS_64K_LIMIT
1229         if (newlen >= 0x10000)
1230             newlen = 0xFFFF;
1231 #endif
1232     }
1233     else
1234         s = SvPVX_mutable(sv);
1235
1236     if (newlen > SvLEN(sv)) {           /* need more room? */
1237         newlen = PERL_STRLEN_ROUNDUP(newlen);
1238         if (SvLEN(sv) && s) {
1239 #ifdef MYMALLOC
1240             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1241             if (newlen <= l) {
1242                 SvLEN_set(sv, l);
1243                 return s;
1244             } else
1245 #endif
1246             s = saferealloc(s, newlen);
1247         }
1248         else {
1249             s = safemalloc(newlen);
1250             if (SvPVX_const(sv) && SvCUR(sv)) {
1251                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1252             }
1253         }
1254         SvPV_set(sv, s);
1255         SvLEN_set(sv, newlen);
1256     }
1257     return s;
1258 }
1259
1260 /*
1261 =for apidoc sv_setiv
1262
1263 Copies an integer into the given SV, upgrading first if necessary.
1264 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1265
1266 =cut
1267 */
1268
1269 void
1270 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1271 {
1272     dVAR;
1273     SV_CHECK_THINKFIRST_COW_DROP(sv);
1274     switch (SvTYPE(sv)) {
1275     case SVt_NULL:
1276         sv_upgrade(sv, SVt_IV);
1277         break;
1278     case SVt_NV:
1279         sv_upgrade(sv, SVt_PVNV);
1280         break;
1281     case SVt_RV:
1282     case SVt_PV:
1283         sv_upgrade(sv, SVt_PVIV);
1284         break;
1285
1286     case SVt_PVGV:
1287     case SVt_PVAV:
1288     case SVt_PVHV:
1289     case SVt_PVCV:
1290     case SVt_PVFM:
1291     case SVt_PVIO:
1292         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1293                    OP_DESC(PL_op));
1294     }
1295     (void)SvIOK_only(sv);                       /* validate number */
1296     SvIV_set(sv, i);
1297     SvTAINT(sv);
1298 }
1299
1300 /*
1301 =for apidoc sv_setiv_mg
1302
1303 Like C<sv_setiv>, but also handles 'set' magic.
1304
1305 =cut
1306 */
1307
1308 void
1309 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1310 {
1311     sv_setiv(sv,i);
1312     SvSETMAGIC(sv);
1313 }
1314
1315 /*
1316 =for apidoc sv_setuv
1317
1318 Copies an unsigned integer into the given SV, upgrading first if necessary.
1319 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1320
1321 =cut
1322 */
1323
1324 void
1325 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1326 {
1327     /* With these two if statements:
1328        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1329
1330        without
1331        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1332
1333        If you wish to remove them, please benchmark to see what the effect is
1334     */
1335     if (u <= (UV)IV_MAX) {
1336        sv_setiv(sv, (IV)u);
1337        return;
1338     }
1339     sv_setiv(sv, 0);
1340     SvIsUV_on(sv);
1341     SvUV_set(sv, u);
1342 }
1343
1344 /*
1345 =for apidoc sv_setuv_mg
1346
1347 Like C<sv_setuv>, but also handles 'set' magic.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1354 {
1355     sv_setiv(sv, 0);
1356     SvIsUV_on(sv);
1357     sv_setuv(sv,u);
1358     SvSETMAGIC(sv);
1359 }
1360
1361 /*
1362 =for apidoc sv_setnv
1363
1364 Copies a double into the given SV, upgrading first if necessary.
1365 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1366
1367 =cut
1368 */
1369
1370 void
1371 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1372 {
1373     dVAR;
1374     SV_CHECK_THINKFIRST_COW_DROP(sv);
1375     switch (SvTYPE(sv)) {
1376     case SVt_NULL:
1377     case SVt_IV:
1378         sv_upgrade(sv, SVt_NV);
1379         break;
1380     case SVt_RV:
1381     case SVt_PV:
1382     case SVt_PVIV:
1383         sv_upgrade(sv, SVt_PVNV);
1384         break;
1385
1386     case SVt_PVGV:
1387     case SVt_PVAV:
1388     case SVt_PVHV:
1389     case SVt_PVCV:
1390     case SVt_PVFM:
1391     case SVt_PVIO:
1392         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1393                    OP_NAME(PL_op));
1394     }
1395     SvNV_set(sv, num);
1396     (void)SvNOK_only(sv);                       /* validate number */
1397     SvTAINT(sv);
1398 }
1399
1400 /*
1401 =for apidoc sv_setnv_mg
1402
1403 Like C<sv_setnv>, but also handles 'set' magic.
1404
1405 =cut
1406 */
1407
1408 void
1409 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1410 {
1411     sv_setnv(sv,num);
1412     SvSETMAGIC(sv);
1413 }
1414
1415 /* Print an "isn't numeric" warning, using a cleaned-up,
1416  * printable version of the offending string
1417  */
1418
1419 STATIC void
1420 S_not_a_number(pTHX_ SV *sv)
1421 {
1422      dVAR;
1423      SV *dsv;
1424      char tmpbuf[64];
1425      const char *pv;
1426
1427      if (DO_UTF8(sv)) {
1428           dsv = sv_2mortal(newSVpvs(""));
1429           pv = sv_uni_display(dsv, sv, 10, 0);
1430      } else {
1431           char *d = tmpbuf;
1432           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1433           /* each *s can expand to 4 chars + "...\0",
1434              i.e. need room for 8 chars */
1435         
1436           const char *s = SvPVX_const(sv);
1437           const char * const end = s + SvCUR(sv);
1438           for ( ; s < end && d < limit; s++ ) {
1439                int ch = *s & 0xFF;
1440                if (ch & 128 && !isPRINT_LC(ch)) {
1441                     *d++ = 'M';
1442                     *d++ = '-';
1443                     ch &= 127;
1444                }
1445                if (ch == '\n') {
1446                     *d++ = '\\';
1447                     *d++ = 'n';
1448                }
1449                else if (ch == '\r') {
1450                     *d++ = '\\';
1451                     *d++ = 'r';
1452                }
1453                else if (ch == '\f') {
1454                     *d++ = '\\';
1455                     *d++ = 'f';
1456                }
1457                else if (ch == '\\') {
1458                     *d++ = '\\';
1459                     *d++ = '\\';
1460                }
1461                else if (ch == '\0') {
1462                     *d++ = '\\';
1463                     *d++ = '0';
1464                }
1465                else if (isPRINT_LC(ch))
1466                     *d++ = ch;
1467                else {
1468                     *d++ = '^';
1469                     *d++ = toCTRL(ch);
1470                }
1471           }
1472           if (s < end) {
1473                *d++ = '.';
1474                *d++ = '.';
1475                *d++ = '.';
1476           }
1477           *d = '\0';
1478           pv = tmpbuf;
1479     }
1480
1481     if (PL_op)
1482         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1483                     "Argument \"%s\" isn't numeric in %s", pv,
1484                     OP_DESC(PL_op));
1485     else
1486         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1487                     "Argument \"%s\" isn't numeric", pv);
1488 }
1489
1490 /*
1491 =for apidoc looks_like_number
1492
1493 Test if the content of an SV looks like a number (or is a number).
1494 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1495 non-numeric warning), even if your atof() doesn't grok them.
1496
1497 =cut
1498 */
1499
1500 I32
1501 Perl_looks_like_number(pTHX_ SV *sv)
1502 {
1503     register const char *sbegin;
1504     STRLEN len;
1505
1506     if (SvPOK(sv)) {
1507         sbegin = SvPVX_const(sv);
1508         len = SvCUR(sv);
1509     }
1510     else if (SvPOKp(sv))
1511         sbegin = SvPV_const(sv, len);
1512     else
1513         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1514     return grok_number(sbegin, len, NULL);
1515 }
1516
1517 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1518    until proven guilty, assume that things are not that bad... */
1519
1520 /*
1521    NV_PRESERVES_UV:
1522
1523    As 64 bit platforms often have an NV that doesn't preserve all bits of
1524    an IV (an assumption perl has been based on to date) it becomes necessary
1525    to remove the assumption that the NV always carries enough precision to
1526    recreate the IV whenever needed, and that the NV is the canonical form.
1527    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1528    precision as a side effect of conversion (which would lead to insanity
1529    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1530    1) to distinguish between IV/UV/NV slots that have cached a valid
1531       conversion where precision was lost and IV/UV/NV slots that have a
1532       valid conversion which has lost no precision
1533    2) to ensure that if a numeric conversion to one form is requested that
1534       would lose precision, the precise conversion (or differently
1535       imprecise conversion) is also performed and cached, to prevent
1536       requests for different numeric formats on the same SV causing
1537       lossy conversion chains. (lossless conversion chains are perfectly
1538       acceptable (still))
1539
1540
1541    flags are used:
1542    SvIOKp is true if the IV slot contains a valid value
1543    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1544    SvNOKp is true if the NV slot contains a valid value
1545    SvNOK  is true only if the NV value is accurate
1546
1547    so
1548    while converting from PV to NV, check to see if converting that NV to an
1549    IV(or UV) would lose accuracy over a direct conversion from PV to
1550    IV(or UV). If it would, cache both conversions, return NV, but mark
1551    SV as IOK NOKp (ie not NOK).
1552
1553    While converting from PV to IV, check to see if converting that IV to an
1554    NV would lose accuracy over a direct conversion from PV to NV. If it
1555    would, cache both conversions, flag similarly.
1556
1557    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1558    correctly because if IV & NV were set NV *always* overruled.
1559    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1560    changes - now IV and NV together means that the two are interchangeable:
1561    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1562
1563    The benefit of this is that operations such as pp_add know that if
1564    SvIOK is true for both left and right operands, then integer addition
1565    can be used instead of floating point (for cases where the result won't
1566    overflow). Before, floating point was always used, which could lead to
1567    loss of precision compared with integer addition.
1568
1569    * making IV and NV equal status should make maths accurate on 64 bit
1570      platforms
1571    * may speed up maths somewhat if pp_add and friends start to use
1572      integers when possible instead of fp. (Hopefully the overhead in
1573      looking for SvIOK and checking for overflow will not outweigh the
1574      fp to integer speedup)
1575    * will slow down integer operations (callers of SvIV) on "inaccurate"
1576      values, as the change from SvIOK to SvIOKp will cause a call into
1577      sv_2iv each time rather than a macro access direct to the IV slot
1578    * should speed up number->string conversion on integers as IV is
1579      favoured when IV and NV are equally accurate
1580
1581    ####################################################################
1582    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1583    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1584    On the other hand, SvUOK is true iff UV.
1585    ####################################################################
1586
1587    Your mileage will vary depending your CPU's relative fp to integer
1588    performance ratio.
1589 */
1590
1591 #ifndef NV_PRESERVES_UV
1592 #  define IS_NUMBER_UNDERFLOW_IV 1
1593 #  define IS_NUMBER_UNDERFLOW_UV 2
1594 #  define IS_NUMBER_IV_AND_UV    2
1595 #  define IS_NUMBER_OVERFLOW_IV  4
1596 #  define IS_NUMBER_OVERFLOW_UV  5
1597
1598 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1599
1600 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1601 STATIC int
1602 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1603 {
1604     dVAR;
1605     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1606     if (SvNVX(sv) < (NV)IV_MIN) {
1607         (void)SvIOKp_on(sv);
1608         (void)SvNOK_on(sv);
1609         SvIV_set(sv, IV_MIN);
1610         return IS_NUMBER_UNDERFLOW_IV;
1611     }
1612     if (SvNVX(sv) > (NV)UV_MAX) {
1613         (void)SvIOKp_on(sv);
1614         (void)SvNOK_on(sv);
1615         SvIsUV_on(sv);
1616         SvUV_set(sv, UV_MAX);
1617         return IS_NUMBER_OVERFLOW_UV;
1618     }
1619     (void)SvIOKp_on(sv);
1620     (void)SvNOK_on(sv);
1621     /* Can't use strtol etc to convert this string.  (See truth table in
1622        sv_2iv  */
1623     if (SvNVX(sv) <= (UV)IV_MAX) {
1624         SvIV_set(sv, I_V(SvNVX(sv)));
1625         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1626             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1627         } else {
1628             /* Integer is imprecise. NOK, IOKp */
1629         }
1630         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1631     }
1632     SvIsUV_on(sv);
1633     SvUV_set(sv, U_V(SvNVX(sv)));
1634     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1635         if (SvUVX(sv) == UV_MAX) {
1636             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1637                possibly be preserved by NV. Hence, it must be overflow.
1638                NOK, IOKp */
1639             return IS_NUMBER_OVERFLOW_UV;
1640         }
1641         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1642     } else {
1643         /* Integer is imprecise. NOK, IOKp */
1644     }
1645     return IS_NUMBER_OVERFLOW_IV;
1646 }
1647 #endif /* !NV_PRESERVES_UV*/
1648
1649 STATIC bool
1650 S_sv_2iuv_common(pTHX_ SV *sv) {
1651     dVAR;
1652     if (SvNOKp(sv)) {
1653         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1654          * without also getting a cached IV/UV from it at the same time
1655          * (ie PV->NV conversion should detect loss of accuracy and cache
1656          * IV or UV at same time to avoid this. */
1657         /* IV-over-UV optimisation - choose to cache IV if possible */
1658
1659         if (SvTYPE(sv) == SVt_NV)
1660             sv_upgrade(sv, SVt_PVNV);
1661
1662         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1663         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1664            certainly cast into the IV range at IV_MAX, whereas the correct
1665            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1666            cases go to UV */
1667         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1668             SvIV_set(sv, I_V(SvNVX(sv)));
1669             if (SvNVX(sv) == (NV) SvIVX(sv)
1670 #ifndef NV_PRESERVES_UV
1671                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1672                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1673                 /* Don't flag it as "accurately an integer" if the number
1674                    came from a (by definition imprecise) NV operation, and
1675                    we're outside the range of NV integer precision */
1676 #endif
1677                 ) {
1678                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1679                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1680                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1681                                       PTR2UV(sv),
1682                                       SvNVX(sv),
1683                                       SvIVX(sv)));
1684
1685             } else {
1686                 /* IV not precise.  No need to convert from PV, as NV
1687                    conversion would already have cached IV if it detected
1688                    that PV->IV would be better than PV->NV->IV
1689                    flags already correct - don't set public IOK.  */
1690                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1691                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1692                                       PTR2UV(sv),
1693                                       SvNVX(sv),
1694                                       SvIVX(sv)));
1695             }
1696             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1697                but the cast (NV)IV_MIN rounds to a the value less (more
1698                negative) than IV_MIN which happens to be equal to SvNVX ??
1699                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1700                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1701                (NV)UVX == NVX are both true, but the values differ. :-(
1702                Hopefully for 2s complement IV_MIN is something like
1703                0x8000000000000000 which will be exact. NWC */
1704         }
1705         else {
1706             SvUV_set(sv, U_V(SvNVX(sv)));
1707             if (
1708                 (SvNVX(sv) == (NV) SvUVX(sv))
1709 #ifndef  NV_PRESERVES_UV
1710                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1711                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1712                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1713                 /* Don't flag it as "accurately an integer" if the number
1714                    came from a (by definition imprecise) NV operation, and
1715                    we're outside the range of NV integer precision */
1716 #endif
1717                 )
1718                 SvIOK_on(sv);
1719             SvIsUV_on(sv);
1720             DEBUG_c(PerlIO_printf(Perl_debug_log,
1721                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1722                                   PTR2UV(sv),
1723                                   SvUVX(sv),
1724                                   SvUVX(sv)));
1725         }
1726     }
1727     else if (SvPOKp(sv) && SvLEN(sv)) {
1728         UV value;
1729         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1730         /* We want to avoid a possible problem when we cache an IV/ a UV which
1731            may be later translated to an NV, and the resulting NV is not
1732            the same as the direct translation of the initial string
1733            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1734            be careful to ensure that the value with the .456 is around if the
1735            NV value is requested in the future).
1736         
1737            This means that if we cache such an IV/a UV, we need to cache the
1738            NV as well.  Moreover, we trade speed for space, and do not
1739            cache the NV if we are sure it's not needed.
1740          */
1741
1742         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1743         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1744              == IS_NUMBER_IN_UV) {
1745             /* It's definitely an integer, only upgrade to PVIV */
1746             if (SvTYPE(sv) < SVt_PVIV)
1747                 sv_upgrade(sv, SVt_PVIV);
1748             (void)SvIOK_on(sv);
1749         } else if (SvTYPE(sv) < SVt_PVNV)
1750             sv_upgrade(sv, SVt_PVNV);
1751
1752         /* If NVs preserve UVs then we only use the UV value if we know that
1753            we aren't going to call atof() below. If NVs don't preserve UVs
1754            then the value returned may have more precision than atof() will
1755            return, even though value isn't perfectly accurate.  */
1756         if ((numtype & (IS_NUMBER_IN_UV
1757 #ifdef NV_PRESERVES_UV
1758                         | IS_NUMBER_NOT_INT
1759 #endif
1760             )) == IS_NUMBER_IN_UV) {
1761             /* This won't turn off the public IOK flag if it was set above  */
1762             (void)SvIOKp_on(sv);
1763
1764             if (!(numtype & IS_NUMBER_NEG)) {
1765                 /* positive */;
1766                 if (value <= (UV)IV_MAX) {
1767                     SvIV_set(sv, (IV)value);
1768                 } else {
1769                     /* it didn't overflow, and it was positive. */
1770                     SvUV_set(sv, value);
1771                     SvIsUV_on(sv);
1772                 }
1773             } else {
1774                 /* 2s complement assumption  */
1775                 if (value <= (UV)IV_MIN) {
1776                     SvIV_set(sv, -(IV)value);
1777                 } else {
1778                     /* Too negative for an IV.  This is a double upgrade, but
1779                        I'm assuming it will be rare.  */
1780                     if (SvTYPE(sv) < SVt_PVNV)
1781                         sv_upgrade(sv, SVt_PVNV);
1782                     SvNOK_on(sv);
1783                     SvIOK_off(sv);
1784                     SvIOKp_on(sv);
1785                     SvNV_set(sv, -(NV)value);
1786                     SvIV_set(sv, IV_MIN);
1787                 }
1788             }
1789         }
1790         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1791            will be in the previous block to set the IV slot, and the next
1792            block to set the NV slot.  So no else here.  */
1793         
1794         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1795             != IS_NUMBER_IN_UV) {
1796             /* It wasn't an (integer that doesn't overflow the UV). */
1797             SvNV_set(sv, Atof(SvPVX_const(sv)));
1798
1799             if (! numtype && ckWARN(WARN_NUMERIC))
1800                 not_a_number(sv);
1801
1802 #if defined(USE_LONG_DOUBLE)
1803             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1804                                   PTR2UV(sv), SvNVX(sv)));
1805 #else
1806             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1807                                   PTR2UV(sv), SvNVX(sv)));
1808 #endif
1809
1810 #ifdef NV_PRESERVES_UV
1811             (void)SvIOKp_on(sv);
1812             (void)SvNOK_on(sv);
1813             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1814                 SvIV_set(sv, I_V(SvNVX(sv)));
1815                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1816                     SvIOK_on(sv);
1817                 } else {
1818                     /* Integer is imprecise. NOK, IOKp */
1819                 }
1820                 /* UV will not work better than IV */
1821             } else {
1822                 if (SvNVX(sv) > (NV)UV_MAX) {
1823                     SvIsUV_on(sv);
1824                     /* Integer is inaccurate. NOK, IOKp, is UV */
1825                     SvUV_set(sv, UV_MAX);
1826                 } else {
1827                     SvUV_set(sv, U_V(SvNVX(sv)));
1828                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
1829                        NV preservse UV so can do correct comparison.  */
1830                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1831                         SvIOK_on(sv);
1832                     } else {
1833                         /* Integer is imprecise. NOK, IOKp, is UV */
1834                     }
1835                 }
1836                 SvIsUV_on(sv);
1837             }
1838 #else /* NV_PRESERVES_UV */
1839             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1840                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1841                 /* The IV/UV slot will have been set from value returned by
1842                    grok_number above.  The NV slot has just been set using
1843                    Atof.  */
1844                 SvNOK_on(sv);
1845                 assert (SvIOKp(sv));
1846             } else {
1847                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1848                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1849                     /* Small enough to preserve all bits. */
1850                     (void)SvIOKp_on(sv);
1851                     SvNOK_on(sv);
1852                     SvIV_set(sv, I_V(SvNVX(sv)));
1853                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1854                         SvIOK_on(sv);
1855                     /* Assumption: first non-preserved integer is < IV_MAX,
1856                        this NV is in the preserved range, therefore: */
1857                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1858                           < (UV)IV_MAX)) {
1859                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1860                     }
1861                 } else {
1862                     /* IN_UV NOT_INT
1863                          0      0       already failed to read UV.
1864                          0      1       already failed to read UV.
1865                          1      0       you won't get here in this case. IV/UV
1866                                         slot set, public IOK, Atof() unneeded.
1867                          1      1       already read UV.
1868                        so there's no point in sv_2iuv_non_preserve() attempting
1869                        to use atol, strtol, strtoul etc.  */
1870                     sv_2iuv_non_preserve (sv, numtype);
1871                 }
1872             }
1873 #endif /* NV_PRESERVES_UV */
1874         }
1875     }
1876     else  {
1877         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1878             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1879                 report_uninit(sv);
1880         }
1881         if (SvTYPE(sv) < SVt_IV)
1882             /* Typically the caller expects that sv_any is not NULL now.  */
1883             sv_upgrade(sv, SVt_IV);
1884         /* Return 0 from the caller.  */
1885         return TRUE;
1886     }
1887     return FALSE;
1888 }
1889
1890 /*
1891 =for apidoc sv_2iv_flags
1892
1893 Return the integer value of an SV, doing any necessary string
1894 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1895 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1896
1897 =cut
1898 */
1899
1900 IV
1901 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1902 {
1903     dVAR;
1904     if (!sv)
1905         return 0;
1906     if (SvGMAGICAL(sv)) {
1907         if (flags & SV_GMAGIC)
1908             mg_get(sv);
1909         if (SvIOKp(sv))
1910             return SvIVX(sv);
1911         if (SvNOKp(sv)) {
1912             return I_V(SvNVX(sv));
1913         }
1914         if (SvPOKp(sv) && SvLEN(sv)) {
1915             UV value;
1916             const int numtype
1917                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1918
1919             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1920                 == IS_NUMBER_IN_UV) {
1921                 /* It's definitely an integer */
1922                 if (numtype & IS_NUMBER_NEG) {
1923                     if (value < (UV)IV_MIN)
1924                         return -(IV)value;
1925                 } else {
1926                     if (value < (UV)IV_MAX)
1927                         return (IV)value;
1928                 }
1929             }
1930             if (!numtype) {
1931                 if (ckWARN(WARN_NUMERIC))
1932                     not_a_number(sv);
1933             }
1934             return I_V(Atof(SvPVX_const(sv)));
1935         }
1936         if (SvROK(sv)) {
1937             goto return_rok;
1938         }
1939         assert(SvTYPE(sv) >= SVt_PVMG);
1940         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
1941     } else if (SvTHINKFIRST(sv)) {
1942         if (SvROK(sv)) {
1943         return_rok:
1944             if (SvAMAGIC(sv)) {
1945                 SV * const tmpstr=AMG_CALLun(sv,numer);
1946                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1947                     return SvIV(tmpstr);
1948                 }
1949             }
1950             return PTR2IV(SvRV(sv));
1951         }
1952         if (SvIsCOW(sv)) {
1953             sv_force_normal_flags(sv, 0);
1954         }
1955         if (SvREADONLY(sv) && !SvOK(sv)) {
1956             if (ckWARN(WARN_UNINITIALIZED))
1957                 report_uninit(sv);
1958             return 0;
1959         }
1960     }
1961     if (!SvIOKp(sv)) {
1962         if (S_sv_2iuv_common(aTHX_ sv))
1963             return 0;
1964     }
1965     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1966         PTR2UV(sv),SvIVX(sv)));
1967     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1968 }
1969
1970 /*
1971 =for apidoc sv_2uv_flags
1972
1973 Return the unsigned integer value of an SV, doing any necessary string
1974 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1975 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1976
1977 =cut
1978 */
1979
1980 UV
1981 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1982 {
1983     dVAR;
1984     if (!sv)
1985         return 0;
1986     if (SvGMAGICAL(sv)) {
1987         if (flags & SV_GMAGIC)
1988             mg_get(sv);
1989         if (SvIOKp(sv))
1990             return SvUVX(sv);
1991         if (SvNOKp(sv))
1992             return U_V(SvNVX(sv));
1993         if (SvPOKp(sv) && SvLEN(sv)) {
1994             UV value;
1995             const int numtype
1996                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1997
1998             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1999                 == IS_NUMBER_IN_UV) {
2000                 /* It's definitely an integer */
2001                 if (!(numtype & IS_NUMBER_NEG))
2002                     return value;
2003             }
2004             if (!numtype) {
2005                 if (ckWARN(WARN_NUMERIC))
2006                     not_a_number(sv);
2007             }
2008             return U_V(Atof(SvPVX_const(sv)));
2009         }
2010         if (SvROK(sv)) {
2011             goto return_rok;
2012         }
2013         assert(SvTYPE(sv) >= SVt_PVMG);
2014         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
2015     } else if (SvTHINKFIRST(sv)) {
2016         if (SvROK(sv)) {
2017         return_rok:
2018             if (SvAMAGIC(sv)) {
2019                 SV *const tmpstr = AMG_CALLun(sv,numer);
2020                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2021                     return SvUV(tmpstr);
2022                 }
2023             }
2024             return PTR2UV(SvRV(sv));
2025         }
2026         if (SvIsCOW(sv)) {
2027             sv_force_normal_flags(sv, 0);
2028         }
2029         if (SvREADONLY(sv) && !SvOK(sv)) {
2030             if (ckWARN(WARN_UNINITIALIZED))
2031                 report_uninit(sv);
2032             return 0;
2033         }
2034     }
2035     if (!SvIOKp(sv)) {
2036         if (S_sv_2iuv_common(aTHX_ sv))
2037             return 0;
2038     }
2039
2040     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2041                           PTR2UV(sv),SvUVX(sv)));
2042     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2043 }
2044
2045 /*
2046 =for apidoc sv_2nv
2047
2048 Return the num value of an SV, doing any necessary string or integer
2049 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2050 macros.
2051
2052 =cut
2053 */
2054
2055 NV
2056 Perl_sv_2nv(pTHX_ register SV *sv)
2057 {
2058     dVAR;
2059     if (!sv)
2060         return 0.0;
2061     if (SvGMAGICAL(sv)) {
2062         mg_get(sv);
2063         if (SvNOKp(sv))
2064             return SvNVX(sv);
2065         if (SvPOKp(sv) && SvLEN(sv)) {
2066             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2067                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2068                 not_a_number(sv);
2069             return Atof(SvPVX_const(sv));
2070         }
2071         if (SvIOKp(sv)) {
2072             if (SvIsUV(sv))
2073                 return (NV)SvUVX(sv);
2074             else
2075                 return (NV)SvIVX(sv);
2076         }
2077         if (SvROK(sv)) {
2078             goto return_rok;
2079         }
2080         assert(SvTYPE(sv) >= SVt_PVMG);
2081         /* This falls through to the report_uninit near the end of the
2082            function. */
2083     } else if (SvTHINKFIRST(sv)) {
2084         if (SvROK(sv)) {
2085         return_rok:
2086             if (SvAMAGIC(sv)) {
2087                 SV *const tmpstr = AMG_CALLun(sv,numer);
2088                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2089                     return SvNV(tmpstr);
2090                 }
2091             }
2092             return PTR2NV(SvRV(sv));
2093         }
2094         if (SvIsCOW(sv)) {
2095             sv_force_normal_flags(sv, 0);
2096         }
2097         if (SvREADONLY(sv) && !SvOK(sv)) {
2098             if (ckWARN(WARN_UNINITIALIZED))
2099                 report_uninit(sv);
2100             return 0.0;
2101         }
2102     }
2103     if (SvTYPE(sv) < SVt_NV) {
2104         /* The logic to use SVt_PVNV if necessary is in sv_upgrade.  */
2105         sv_upgrade(sv, SVt_NV);
2106 #ifdef USE_LONG_DOUBLE
2107         DEBUG_c({
2108             STORE_NUMERIC_LOCAL_SET_STANDARD();
2109             PerlIO_printf(Perl_debug_log,
2110                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2111                           PTR2UV(sv), SvNVX(sv));
2112             RESTORE_NUMERIC_LOCAL();
2113         });
2114 #else
2115         DEBUG_c({
2116             STORE_NUMERIC_LOCAL_SET_STANDARD();
2117             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2118                           PTR2UV(sv), SvNVX(sv));
2119             RESTORE_NUMERIC_LOCAL();
2120         });
2121 #endif
2122     }
2123     else if (SvTYPE(sv) < SVt_PVNV)
2124         sv_upgrade(sv, SVt_PVNV);
2125     if (SvNOKp(sv)) {
2126         return SvNVX(sv);
2127     }
2128     if (SvIOKp(sv)) {
2129         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2130 #ifdef NV_PRESERVES_UV
2131         SvNOK_on(sv);
2132 #else
2133         /* Only set the public NV OK flag if this NV preserves the IV  */
2134         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2135         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2136                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2137             SvNOK_on(sv);
2138         else
2139             SvNOKp_on(sv);
2140 #endif
2141     }
2142     else if (SvPOKp(sv) && SvLEN(sv)) {
2143         UV value;
2144         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2145         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2146             not_a_number(sv);
2147 #ifdef NV_PRESERVES_UV
2148         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2149             == IS_NUMBER_IN_UV) {
2150             /* It's definitely an integer */
2151             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2152         } else
2153             SvNV_set(sv, Atof(SvPVX_const(sv)));
2154         SvNOK_on(sv);
2155 #else
2156         SvNV_set(sv, Atof(SvPVX_const(sv)));
2157         /* Only set the public NV OK flag if this NV preserves the value in
2158            the PV at least as well as an IV/UV would.
2159            Not sure how to do this 100% reliably. */
2160         /* if that shift count is out of range then Configure's test is
2161            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2162            UV_BITS */
2163         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2164             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2165             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2166         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2167             /* Can't use strtol etc to convert this string, so don't try.
2168                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2169             SvNOK_on(sv);
2170         } else {
2171             /* value has been set.  It may not be precise.  */
2172             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2173                 /* 2s complement assumption for (UV)IV_MIN  */
2174                 SvNOK_on(sv); /* Integer is too negative.  */
2175             } else {
2176                 SvNOKp_on(sv);
2177                 SvIOKp_on(sv);
2178
2179                 if (numtype & IS_NUMBER_NEG) {
2180                     SvIV_set(sv, -(IV)value);
2181                 } else if (value <= (UV)IV_MAX) {
2182                     SvIV_set(sv, (IV)value);
2183                 } else {
2184                     SvUV_set(sv, value);
2185                     SvIsUV_on(sv);
2186                 }
2187
2188                 if (numtype & IS_NUMBER_NOT_INT) {
2189                     /* I believe that even if the original PV had decimals,
2190                        they are lost beyond the limit of the FP precision.
2191                        However, neither is canonical, so both only get p
2192                        flags.  NWC, 2000/11/25 */
2193                     /* Both already have p flags, so do nothing */
2194                 } else {
2195                     const NV nv = SvNVX(sv);
2196                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2197                         if (SvIVX(sv) == I_V(nv)) {
2198                             SvNOK_on(sv);
2199                         } else {
2200                             /* It had no "." so it must be integer.  */
2201                         }
2202                         SvIOK_on(sv);
2203                     } else {
2204                         /* between IV_MAX and NV(UV_MAX).
2205                            Could be slightly > UV_MAX */
2206
2207                         if (numtype & IS_NUMBER_NOT_INT) {
2208                             /* UV and NV both imprecise.  */
2209                         } else {
2210                             const UV nv_as_uv = U_V(nv);
2211
2212                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2213                                 SvNOK_on(sv);
2214                             }
2215                             SvIOK_on(sv);
2216                         }
2217                     }
2218                 }
2219             }
2220         }
2221 #endif /* NV_PRESERVES_UV */
2222     }
2223     else  {
2224         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2225             report_uninit(sv);
2226         assert (SvTYPE(sv) >= SVt_NV);
2227         /* Typically the caller expects that sv_any is not NULL now.  */
2228         /* XXX Ilya implies that this is a bug in callers that assume this
2229            and ideally should be fixed.  */
2230         return 0.0;
2231     }
2232 #if defined(USE_LONG_DOUBLE)
2233     DEBUG_c({
2234         STORE_NUMERIC_LOCAL_SET_STANDARD();
2235         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2236                       PTR2UV(sv), SvNVX(sv));
2237         RESTORE_NUMERIC_LOCAL();
2238     });
2239 #else
2240     DEBUG_c({
2241         STORE_NUMERIC_LOCAL_SET_STANDARD();
2242         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2243                       PTR2UV(sv), SvNVX(sv));
2244         RESTORE_NUMERIC_LOCAL();
2245     });
2246 #endif
2247     return SvNVX(sv);
2248 }
2249
2250 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2251  * UV as a string towards the end of buf, and return pointers to start and
2252  * end of it.
2253  *
2254  * We assume that buf is at least TYPE_CHARS(UV) long.
2255  */
2256
2257 static char *
2258 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2259 {
2260     char *ptr = buf + TYPE_CHARS(UV);
2261     char * const ebuf = ptr;
2262     int sign;
2263
2264     if (is_uv)
2265         sign = 0;
2266     else if (iv >= 0) {
2267         uv = iv;
2268         sign = 0;
2269     } else {
2270         uv = -iv;
2271         sign = 1;
2272     }
2273     do {
2274         *--ptr = '0' + (char)(uv % 10);
2275     } while (uv /= 10);
2276     if (sign)
2277         *--ptr = '-';
2278     *peob = ebuf;
2279     return ptr;
2280 }
2281
2282 /* stringify_regexp(): private routine for use by sv_2pv_flags(): converts
2283  * a regexp to its stringified form.
2284  */
2285
2286 static char *
2287 S_stringify_regexp(pTHX_ SV *sv, MAGIC *mg, STRLEN *lp) {
2288     dVAR;
2289     const regexp * const re = (regexp *)mg->mg_obj;
2290
2291     if (!mg->mg_ptr) {
2292         const char *fptr = "msix";
2293         char reflags[6];
2294         char ch;
2295         int left = 0;
2296         int right = 4;
2297         bool need_newline = 0;
2298         U16 reganch = (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2299
2300         while((ch = *fptr++)) {
2301             if(reganch & 1) {
2302                 reflags[left++] = ch;
2303             }
2304             else {
2305                 reflags[right--] = ch;
2306             }
2307             reganch >>= 1;
2308         }
2309         if(left != 4) {
2310             reflags[left] = '-';
2311             left = 5;
2312         }
2313
2314         mg->mg_len = re->prelen + 4 + left;
2315         /*
2316          * If /x was used, we have to worry about a regex ending with a
2317          * comment later being embedded within another regex. If so, we don't
2318          * want this regex's "commentization" to leak out to the right part of
2319          * the enclosing regex, we must cap it with a newline.
2320          *
2321          * So, if /x was used, we scan backwards from the end of the regex. If
2322          * we find a '#' before we find a newline, we need to add a newline
2323          * ourself. If we find a '\n' first (or if we don't find '#' or '\n'),
2324          * we don't need to add anything.  -jfriedl
2325          */
2326         if (PMf_EXTENDED & re->reganch) {
2327             const char *endptr = re->precomp + re->prelen;
2328             while (endptr >= re->precomp) {
2329                 const char c = *(endptr--);
2330                 if (c == '\n')
2331                     break; /* don't need another */
2332                 if (c == '#') {
2333                     /* we end while in a comment, so we need a newline */
2334                     mg->mg_len++; /* save space for it */
2335                     need_newline = 1; /* note to add it */
2336                     break;
2337                 }
2338             }
2339         }
2340
2341         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2342         mg->mg_ptr[0] = '(';
2343         mg->mg_ptr[1] = '?';
2344         Copy(reflags, mg->mg_ptr+2, left, char);
2345         *(mg->mg_ptr+left+2) = ':';
2346         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2347         if (need_newline)
2348             mg->mg_ptr[mg->mg_len - 2] = '\n';
2349         mg->mg_ptr[mg->mg_len - 1] = ')';
2350         mg->mg_ptr[mg->mg_len] = 0;
2351     }
2352     PL_reginterp_cnt += re->program[0].next_off;
2353     
2354     if (re->reganch & ROPT_UTF8)
2355         SvUTF8_on(sv);
2356     else
2357         SvUTF8_off(sv);
2358     if (lp)
2359         *lp = mg->mg_len;
2360     return mg->mg_ptr;
2361 }
2362
2363 /*
2364 =for apidoc sv_2pv_flags
2365
2366 Returns a pointer to the string value of an SV, and sets *lp to its length.
2367 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2368 if necessary.
2369 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2370 usually end up here too.
2371
2372 =cut
2373 */
2374
2375 char *
2376 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2377 {
2378     dVAR;
2379     register char *s;
2380
2381     if (!sv) {
2382         if (lp)
2383             *lp = 0;
2384         return (char *)"";
2385     }
2386     if (SvGMAGICAL(sv)) {
2387         if (flags & SV_GMAGIC)
2388             mg_get(sv);
2389         if (SvPOKp(sv)) {
2390             if (lp)
2391                 *lp = SvCUR(sv);
2392             if (flags & SV_MUTABLE_RETURN)
2393                 return SvPVX_mutable(sv);
2394             if (flags & SV_CONST_RETURN)
2395                 return (char *)SvPVX_const(sv);
2396             return SvPVX(sv);
2397         }
2398         if (SvIOKp(sv) || SvNOKp(sv)) {
2399             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2400             STRLEN len;
2401
2402             if (SvIOKp(sv)) {
2403                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2404                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2405             } else {
2406                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2407                 len = strlen(tbuf);
2408             }
2409             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2410                 /* Sneaky stuff here */
2411                 SV * const tsv = newSVpvn(tbuf, len);
2412
2413                 sv_2mortal(tsv);
2414                 if (lp)
2415                     *lp = SvCUR(tsv);
2416                 return SvPVX(tsv);
2417             }
2418             else {
2419                 dVAR;
2420
2421 #ifdef FIXNEGATIVEZERO
2422                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2423                     tbuf[0] = '0';
2424                     tbuf[1] = 0;
2425                     len = 1;
2426                 }
2427 #endif
2428                 SvUPGRADE(sv, SVt_PV);
2429                 if (lp)
2430                     *lp = len;
2431                 s = SvGROW_mutable(sv, len + 1);
2432                 SvCUR_set(sv, len);
2433                 SvPOKp_on(sv);
2434                 return memcpy(s, tbuf, len + 1);
2435             }
2436         }
2437         if (SvROK(sv)) {
2438             goto return_rok;
2439         }
2440         assert(SvTYPE(sv) >= SVt_PVMG);
2441         /* This falls through to the report_uninit near the end of the
2442            function. */
2443     } else if (SvTHINKFIRST(sv)) {
2444         if (SvROK(sv)) {
2445         return_rok:
2446             if (SvAMAGIC(sv)) {
2447                 SV *const tmpstr = AMG_CALLun(sv,string);
2448                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2449                     /* Unwrap this:  */
2450                     /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr);
2451                      */
2452
2453                     char *pv;
2454                     if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2455                         if (flags & SV_CONST_RETURN) {
2456                             pv = (char *) SvPVX_const(tmpstr);
2457                         } else {
2458                             pv = (flags & SV_MUTABLE_RETURN)
2459                                 ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2460                         }
2461                         if (lp)
2462                             *lp = SvCUR(tmpstr);
2463                     } else {
2464                         pv = sv_2pv_flags(tmpstr, lp, flags);
2465                     }
2466                     if (SvUTF8(tmpstr))
2467                         SvUTF8_on(sv);
2468                     else
2469                         SvUTF8_off(sv);
2470                     return pv;
2471                 }
2472             }
2473             {
2474                 SV *tsv;
2475                 MAGIC *mg;
2476                 const SV *const referent = (SV*)SvRV(sv);
2477
2478                 if (!referent) {
2479                     tsv = sv_2mortal(newSVpvs("NULLREF"));
2480                 } else if (SvTYPE(referent) == SVt_PVMG
2481                            && ((SvFLAGS(referent) &
2482                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2483                                == (SVs_OBJECT|SVs_SMG))
2484                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2485                     return stringify_regexp(sv, mg, lp);
2486                 } else {
2487                     const char *const typestr = sv_reftype(referent, 0);
2488
2489                     tsv = sv_newmortal();
2490                     if (SvOBJECT(referent)) {
2491                         const char *const name = HvNAME_get(SvSTASH(referent));
2492                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2493                                        name ? name : "__ANON__" , typestr,
2494                                        PTR2UV(referent));
2495                     }
2496                     else
2497                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2498                                        PTR2UV(referent));
2499                 }
2500                 if (lp)
2501                     *lp = SvCUR(tsv);
2502                 return SvPVX(tsv);
2503             }
2504         }
2505         if (SvREADONLY(sv) && !SvOK(sv)) {
2506             if (ckWARN(WARN_UNINITIALIZED))
2507                 report_uninit(sv);
2508             if (lp)
2509                 *lp = 0;
2510             return (char *)"";
2511         }
2512     }
2513     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2514         /* I'm assuming that if both IV and NV are equally valid then
2515            converting the IV is going to be more efficient */
2516         const U32 isIOK = SvIOK(sv);
2517         const U32 isUIOK = SvIsUV(sv);
2518         char buf[TYPE_CHARS(UV)];
2519         char *ebuf, *ptr;
2520
2521         if (SvTYPE(sv) < SVt_PVIV)
2522             sv_upgrade(sv, SVt_PVIV);
2523         ptr = uiv_2buf(buf, SvIVX(sv), SvUVX(sv), isUIOK, &ebuf);
2524         /* inlined from sv_setpvn */
2525         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2526         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2527         SvCUR_set(sv, ebuf - ptr);
2528         s = SvEND(sv);
2529         *s = '\0';
2530         if (isIOK)
2531             SvIOK_on(sv);
2532         else
2533             SvIOKp_on(sv);
2534         if (isUIOK)
2535             SvIsUV_on(sv);
2536     }
2537     else if (SvNOKp(sv)) {
2538         const int olderrno = errno;
2539         if (SvTYPE(sv) < SVt_PVNV)
2540             sv_upgrade(sv, SVt_PVNV);
2541         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2542         s = SvGROW_mutable(sv, NV_DIG + 20);
2543         /* some Xenix systems wipe out errno here */
2544 #ifdef apollo
2545         if (SvNVX(sv) == 0.0)
2546             (void)strcpy(s,"0");
2547         else
2548 #endif /*apollo*/
2549         {
2550             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2551         }
2552         errno = olderrno;
2553 #ifdef FIXNEGATIVEZERO
2554         if (*s == '-' && s[1] == '0' && !s[2])
2555             strcpy(s,"0");
2556 #endif
2557         while (*s) s++;
2558 #ifdef hcx
2559         if (s[-1] == '.')
2560             *--s = '\0';
2561 #endif
2562     }
2563     else {
2564         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2565             report_uninit(sv);
2566         if (lp)
2567             *lp = 0;
2568         if (SvTYPE(sv) < SVt_PV)
2569             /* Typically the caller expects that sv_any is not NULL now.  */
2570             sv_upgrade(sv, SVt_PV);
2571         return (char *)"";
2572     }
2573     {
2574         const STRLEN len = s - SvPVX_const(sv);
2575         if (lp) 
2576             *lp = len;
2577         SvCUR_set(sv, len);
2578     }
2579     SvPOK_on(sv);
2580     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2581                           PTR2UV(sv),SvPVX_const(sv)));
2582     if (flags & SV_CONST_RETURN)
2583         return (char *)SvPVX_const(sv);
2584     if (flags & SV_MUTABLE_RETURN)
2585         return SvPVX_mutable(sv);
2586     return SvPVX(sv);
2587 }
2588
2589 /*
2590 =for apidoc sv_copypv
2591
2592 Copies a stringified representation of the source SV into the
2593 destination SV.  Automatically performs any necessary mg_get and
2594 coercion of numeric values into strings.  Guaranteed to preserve
2595 UTF-8 flag even from overloaded objects.  Similar in nature to
2596 sv_2pv[_flags] but operates directly on an SV instead of just the
2597 string.  Mostly uses sv_2pv_flags to do its work, except when that
2598 would lose the UTF-8'ness of the PV.
2599
2600 =cut
2601 */
2602
2603 void
2604 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2605 {
2606     STRLEN len;
2607     const char * const s = SvPV_const(ssv,len);
2608     sv_setpvn(dsv,s,len);
2609     if (SvUTF8(ssv))
2610         SvUTF8_on(dsv);
2611     else
2612         SvUTF8_off(dsv);
2613 }
2614
2615 /*
2616 =for apidoc sv_2pvbyte
2617
2618 Return a pointer to the byte-encoded representation of the SV, and set *lp
2619 to its length.  May cause the SV to be downgraded from UTF-8 as a
2620 side-effect.
2621
2622 Usually accessed via the C<SvPVbyte> macro.
2623
2624 =cut
2625 */
2626
2627 char *
2628 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2629 {
2630     sv_utf8_downgrade(sv,0);
2631     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2632 }
2633
2634 /*
2635 =for apidoc sv_2pvutf8
2636
2637 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2638 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2639
2640 Usually accessed via the C<SvPVutf8> macro.
2641
2642 =cut
2643 */
2644
2645 char *
2646 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2647 {
2648     sv_utf8_upgrade(sv);
2649     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2650 }
2651
2652
2653 /*
2654 =for apidoc sv_2bool
2655
2656 This function is only called on magical items, and is only used by
2657 sv_true() or its macro equivalent.
2658
2659 =cut
2660 */
2661
2662 bool
2663 Perl_sv_2bool(pTHX_ register SV *sv)
2664 {
2665     dVAR;
2666     SvGETMAGIC(sv);
2667
2668     if (!SvOK(sv))
2669         return 0;
2670     if (SvROK(sv)) {
2671         if (SvAMAGIC(sv)) {
2672             SV * const tmpsv = AMG_CALLun(sv,bool_);
2673             if (tmpsv && (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2674                 return (bool)SvTRUE(tmpsv);
2675         }
2676         return SvRV(sv) != 0;
2677     }
2678     if (SvPOKp(sv)) {
2679         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2680         if (Xpvtmp &&
2681                 (*sv->sv_u.svu_pv > '0' ||
2682                 Xpvtmp->xpv_cur > 1 ||
2683                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2684             return 1;
2685         else
2686             return 0;
2687     }
2688     else {
2689         if (SvIOKp(sv))
2690             return SvIVX(sv) != 0;
2691         else {
2692             if (SvNOKp(sv))
2693                 return SvNVX(sv) != 0.0;
2694             else
2695                 return FALSE;
2696         }
2697     }
2698 }
2699
2700 /*
2701 =for apidoc sv_utf8_upgrade
2702
2703 Converts the PV of an SV to its UTF-8-encoded form.
2704 Forces the SV to string form if it is not already.
2705 Always sets the SvUTF8 flag to avoid future validity checks even
2706 if all the bytes have hibit clear.
2707
2708 This is not as a general purpose byte encoding to Unicode interface:
2709 use the Encode extension for that.
2710
2711 =for apidoc sv_utf8_upgrade_flags
2712
2713 Converts the PV of an SV to its UTF-8-encoded form.
2714 Forces the SV to string form if it is not already.
2715 Always sets the SvUTF8 flag to avoid future validity checks even
2716 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2717 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2718 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2719
2720 This is not as a general purpose byte encoding to Unicode interface:
2721 use the Encode extension for that.
2722
2723 =cut
2724 */
2725
2726 STRLEN
2727 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2728 {
2729     dVAR;
2730     if (sv == &PL_sv_undef)
2731         return 0;
2732     if (!SvPOK(sv)) {
2733         STRLEN len = 0;
2734         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2735             (void) sv_2pv_flags(sv,&len, flags);
2736             if (SvUTF8(sv))
2737                 return len;
2738         } else {
2739             (void) SvPV_force(sv,len);
2740         }
2741     }
2742
2743     if (SvUTF8(sv)) {
2744         return SvCUR(sv);
2745     }
2746
2747     if (SvIsCOW(sv)) {
2748         sv_force_normal_flags(sv, 0);
2749     }
2750
2751     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2752         sv_recode_to_utf8(sv, PL_encoding);
2753     else { /* Assume Latin-1/EBCDIC */
2754         /* This function could be much more efficient if we
2755          * had a FLAG in SVs to signal if there are any hibit
2756          * chars in the PV.  Given that there isn't such a flag
2757          * make the loop as fast as possible. */
2758         const U8 * const s = (U8 *) SvPVX_const(sv);
2759         const U8 * const e = (U8 *) SvEND(sv);
2760         const U8 *t = s;
2761         
2762         while (t < e) {
2763             const U8 ch = *t++;
2764             /* Check for hi bit */
2765             if (!NATIVE_IS_INVARIANT(ch)) {
2766                 STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2767                 U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2768
2769                 SvPV_free(sv); /* No longer using what was there before. */
2770                 SvPV_set(sv, (char*)recoded);
2771                 SvCUR_set(sv, len - 1);
2772                 SvLEN_set(sv, len); /* No longer know the real size. */
2773                 break;
2774             }
2775         }
2776         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2777         SvUTF8_on(sv);
2778     }
2779     return SvCUR(sv);
2780 }
2781
2782 /*
2783 =for apidoc sv_utf8_downgrade
2784
2785 Attempts to convert the PV of an SV from characters to bytes.
2786 If the PV contains a character beyond byte, this conversion will fail;
2787 in this case, either returns false or, if C<fail_ok> is not
2788 true, croaks.
2789
2790 This is not as a general purpose Unicode to byte encoding interface:
2791 use the Encode extension for that.
2792
2793 =cut
2794 */
2795
2796 bool
2797 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
2798 {
2799     dVAR;
2800     if (SvPOKp(sv) && SvUTF8(sv)) {
2801         if (SvCUR(sv)) {
2802             U8 *s;
2803             STRLEN len;
2804
2805             if (SvIsCOW(sv)) {
2806                 sv_force_normal_flags(sv, 0);
2807             }
2808             s = (U8 *) SvPV(sv, len);
2809             if (!utf8_to_bytes(s, &len)) {
2810                 if (fail_ok)
2811                     return FALSE;
2812                 else {
2813                     if (PL_op)
2814                         Perl_croak(aTHX_ "Wide character in %s",
2815                                    OP_DESC(PL_op));
2816                     else
2817                         Perl_croak(aTHX_ "Wide character");
2818                 }
2819             }
2820             SvCUR_set(sv, len);
2821         }
2822     }
2823     SvUTF8_off(sv);
2824     return TRUE;
2825 }
2826
2827 /*
2828 =for apidoc sv_utf8_encode
2829
2830 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
2831 flag off so that it looks like octets again.
2832
2833 =cut
2834 */
2835
2836 void
2837 Perl_sv_utf8_encode(pTHX_ register SV *sv)
2838 {
2839     (void) sv_utf8_upgrade(sv);
2840     if (SvIsCOW(sv)) {
2841         sv_force_normal_flags(sv, 0);
2842     }
2843     if (SvREADONLY(sv)) {
2844         Perl_croak(aTHX_ PL_no_modify);
2845     }
2846     SvUTF8_off(sv);
2847 }
2848
2849 /*
2850 =for apidoc sv_utf8_decode
2851
2852 If the PV of the SV is an octet sequence in UTF-8
2853 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
2854 so that it looks like a character. If the PV contains only single-byte
2855 characters, the C<SvUTF8> flag stays being off.
2856 Scans PV for validity and returns false if the PV is invalid UTF-8.
2857
2858 =cut
2859 */
2860
2861 bool
2862 Perl_sv_utf8_decode(pTHX_ register SV *sv)
2863 {
2864     if (SvPOKp(sv)) {
2865         const U8 *c;
2866         const U8 *e;
2867
2868         /* The octets may have got themselves encoded - get them back as
2869          * bytes
2870          */
2871         if (!sv_utf8_downgrade(sv, TRUE))
2872             return FALSE;
2873
2874         /* it is actually just a matter of turning the utf8 flag on, but
2875          * we want to make sure everything inside is valid utf8 first.
2876          */
2877         c = (const U8 *) SvPVX_const(sv);
2878         if (!is_utf8_string(c, SvCUR(sv)+1))
2879             return FALSE;
2880         e = (const U8 *) SvEND(sv);
2881         while (c < e) {
2882             const U8 ch = *c++;
2883             if (!UTF8_IS_INVARIANT(ch)) {
2884                 SvUTF8_on(sv);
2885                 break;
2886             }
2887         }
2888     }
2889     return TRUE;
2890 }
2891
2892 /*
2893 =for apidoc sv_setsv
2894
2895 Copies the contents of the source SV C<ssv> into the destination SV
2896 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2897 function if the source SV needs to be reused. Does not handle 'set' magic.
2898 Loosely speaking, it performs a copy-by-value, obliterating any previous
2899 content of the destination.
2900
2901 You probably want to use one of the assortment of wrappers, such as
2902 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2903 C<SvSetMagicSV_nosteal>.
2904
2905 =for apidoc sv_setsv_flags
2906
2907 Copies the contents of the source SV C<ssv> into the destination SV
2908 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2909 function if the source SV needs to be reused. Does not handle 'set' magic.
2910 Loosely speaking, it performs a copy-by-value, obliterating any previous
2911 content of the destination.
2912 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
2913 C<ssv> if appropriate, else not. If the C<flags> parameter has the
2914 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
2915 and C<sv_setsv_nomg> are implemented in terms of this function.
2916
2917 You probably want to use one of the assortment of wrappers, such as
2918 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2919 C<SvSetMagicSV_nosteal>.
2920
2921 This is the primary function for copying scalars, and most other
2922 copy-ish functions and macros use this underneath.
2923
2924 =cut
2925 */
2926
2927 void
2928 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
2929 {
2930     dVAR;
2931     register U32 sflags;
2932     register int dtype;
2933     register int stype;
2934
2935     if (sstr == dstr)
2936         return;
2937     SV_CHECK_THINKFIRST_COW_DROP(dstr);
2938     if (!sstr)
2939         sstr = &PL_sv_undef;
2940     stype = SvTYPE(sstr);
2941     dtype = SvTYPE(dstr);
2942
2943     SvAMAGIC_off(dstr);
2944     if ( SvVOK(dstr) )
2945     {
2946         /* need to nuke the magic */
2947         mg_free(dstr);
2948         SvRMAGICAL_off(dstr);
2949     }
2950
2951     /* There's a lot of redundancy below but we're going for speed here */
2952
2953     switch (stype) {
2954     case SVt_NULL:
2955       undef_sstr:
2956         if (dtype != SVt_PVGV) {
2957             (void)SvOK_off(dstr);
2958             return;
2959         }
2960         break;
2961     case SVt_IV:
2962         if (SvIOK(sstr)) {
2963             switch (dtype) {
2964             case SVt_NULL:
2965                 sv_upgrade(dstr, SVt_IV);
2966                 break;
2967             case SVt_NV:
2968                 sv_upgrade(dstr, SVt_PVNV);
2969                 break;
2970             case SVt_RV:
2971             case SVt_PV:
2972                 sv_upgrade(dstr, SVt_PVIV);
2973                 break;
2974             }
2975             (void)SvIOK_only(dstr);
2976             SvIV_set(dstr,  SvIVX(sstr));
2977             if (SvIsUV(sstr))
2978                 SvIsUV_on(dstr);
2979             if (SvTAINTED(sstr))
2980                 SvTAINT(dstr);
2981             return;
2982         }
2983         goto undef_sstr;
2984
2985     case SVt_NV:
2986         if (SvNOK(sstr)) {
2987             switch (dtype) {
2988             case SVt_NULL:
2989             case SVt_IV:
2990                 sv_upgrade(dstr, SVt_NV);
2991                 break;
2992             case SVt_RV:
2993             case SVt_PV:
2994             case SVt_PVIV:
2995                 sv_upgrade(dstr, SVt_PVNV);
2996                 break;
2997             }
2998             SvNV_set(dstr, SvNVX(sstr));
2999             (void)SvNOK_only(dstr);
3000             if (SvTAINTED(sstr))
3001                 SvTAINT(dstr);
3002             return;
3003         }
3004         goto undef_sstr;
3005
3006     case SVt_RV:
3007         if (dtype < SVt_RV)
3008             sv_upgrade(dstr, SVt_RV);
3009         else if (dtype == SVt_PVGV &&
3010                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
3011             sstr = SvRV(sstr);
3012             if (sstr == dstr) {
3013                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3014                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3015                 {
3016                     GvIMPORTED_on(dstr);
3017                 }
3018                 GvMULTI_on(dstr);
3019                 return;
3020             }
3021             goto glob_assign;
3022         }
3023         break;
3024     case SVt_PVFM:
3025 #ifdef PERL_OLD_COPY_ON_WRITE
3026         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3027             if (dtype < SVt_PVIV)
3028                 sv_upgrade(dstr, SVt_PVIV);
3029             break;
3030         }
3031         /* Fall through */
3032 #endif
3033     case SVt_PV:
3034         if (dtype < SVt_PV)
3035             sv_upgrade(dstr, SVt_PV);
3036         break;
3037     case SVt_PVIV:
3038         if (dtype < SVt_PVIV)
3039             sv_upgrade(dstr, SVt_PVIV);
3040         break;
3041     case SVt_PVNV:
3042         if (dtype < SVt_PVNV)
3043             sv_upgrade(dstr, SVt_PVNV);
3044         break;
3045     case SVt_PVAV:
3046     case SVt_PVHV:
3047     case SVt_PVCV:
3048     case SVt_PVIO:
3049         {
3050         const char * const type = sv_reftype(sstr,0);
3051         if (PL_op)
3052             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3053         else
3054             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3055         }
3056         break;
3057
3058     case SVt_PVGV:
3059         if (dtype <= SVt_PVGV) {
3060   glob_assign:
3061             if (dtype != SVt_PVGV) {
3062                 const char * const name = GvNAME(sstr);
3063                 const STRLEN len = GvNAMELEN(sstr);
3064                 /* don't upgrade SVt_PVLV: it can hold a glob */
3065                 if (dtype != SVt_PVLV)
3066                     sv_upgrade(dstr, SVt_PVGV);
3067                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3068                 GvSTASH(dstr) = GvSTASH(sstr);
3069                 if (GvSTASH(dstr))
3070                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3071                 GvNAME(dstr) = savepvn(name, len);
3072                 GvNAMELEN(dstr) = len;
3073                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3074             }
3075
3076 #ifdef GV_UNIQUE_CHECK
3077                 if (GvUNIQUE((GV*)dstr)) {
3078                     Perl_croak(aTHX_ PL_no_modify);
3079                 }
3080 #endif
3081
3082             (void)SvOK_off(dstr);
3083             GvINTRO_off(dstr);          /* one-shot flag */
3084             gp_free((GV*)dstr);
3085             GvGP(dstr) = gp_ref(GvGP(sstr));
3086             if (SvTAINTED(sstr))
3087                 SvTAINT(dstr);
3088             if (GvIMPORTED(dstr) != GVf_IMPORTED
3089                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3090             {
3091                 GvIMPORTED_on(dstr);
3092             }
3093             GvMULTI_on(dstr);
3094             return;
3095         }
3096         /* FALL THROUGH */
3097
3098     default:
3099         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3100             mg_get(sstr);
3101             if ((int)SvTYPE(sstr) != stype) {
3102                 stype = SvTYPE(sstr);
3103                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3104                     goto glob_assign;
3105             }
3106         }
3107         if (stype == SVt_PVLV)
3108             SvUPGRADE(dstr, SVt_PVNV);
3109         else
3110             SvUPGRADE(dstr, (U32)stype);
3111     }
3112
3113     sflags = SvFLAGS(sstr);
3114
3115     if (sflags & SVf_ROK) {
3116         if (dtype >= SVt_PV) {
3117             if (dtype == SVt_PVGV) {
3118                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3119                 SV *dref = NULL;
3120                 const int intro = GvINTRO(dstr);
3121
3122 #ifdef GV_UNIQUE_CHECK
3123                 if (GvUNIQUE((GV*)dstr)) {
3124                     Perl_croak(aTHX_ PL_no_modify);
3125                 }
3126 #endif
3127
3128                 if (intro) {
3129                     GvINTRO_off(dstr);  /* one-shot flag */
3130                     GvLINE(dstr) = CopLINE(PL_curcop);
3131                     GvEGV(dstr) = (GV*)dstr;
3132                 }
3133                 GvMULTI_on(dstr);
3134                 switch (SvTYPE(sref)) {
3135                 case SVt_PVAV:
3136                     if (intro)
3137                         SAVEGENERICSV(GvAV(dstr));
3138                     else
3139                         dref = (SV*)GvAV(dstr);
3140                     GvAV(dstr) = (AV*)sref;
3141                     if (!GvIMPORTED_AV(dstr)
3142                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3143                     {
3144                         GvIMPORTED_AV_on(dstr);
3145                     }
3146                     break;
3147                 case SVt_PVHV:
3148                     if (intro)
3149                         SAVEGENERICSV(GvHV(dstr));
3150                     else
3151                         dref = (SV*)GvHV(dstr);
3152                     GvHV(dstr) = (HV*)sref;
3153                     if (!GvIMPORTED_HV(dstr)
3154                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3155                     {
3156                         GvIMPORTED_HV_on(dstr);
3157                     }
3158                     break;
3159                 case SVt_PVCV:
3160                     if (intro) {
3161                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3162                             SvREFCNT_dec(GvCV(dstr));
3163                             GvCV(dstr) = Nullcv;
3164                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3165                             PL_sub_generation++;
3166                         }
3167                         SAVEGENERICSV(GvCV(dstr));
3168                     }
3169                     else
3170                         dref = (SV*)GvCV(dstr);
3171                     if (GvCV(dstr) != (CV*)sref) {
3172                         CV* const cv = GvCV(dstr);
3173                         if (cv) {
3174                             if (!GvCVGEN((GV*)dstr) &&
3175                                 (CvROOT(cv) || CvXSUB(cv)))
3176                             {
3177                                 /* Redefining a sub - warning is mandatory if
3178                                    it was a const and its value changed. */
3179                                 if (CvCONST(cv) && CvCONST((CV*)sref)
3180                                     && cv_const_sv(cv)
3181                                     == cv_const_sv((CV*)sref)) {
3182                                     /* They are 2 constant subroutines
3183                                        generated from the same constant.
3184                                        This probably means that they are
3185                                        really the "same" proxy subroutine
3186                                        instantiated in 2 places. Most likely
3187                                        this is when a constant is exported
3188                                        twice.  Don't warn.  */
3189                                 }
3190                                 else if (ckWARN(WARN_REDEFINE)
3191                                     || (CvCONST(cv)
3192                                         && (!CvCONST((CV*)sref)
3193                                             || sv_cmp(cv_const_sv(cv),
3194                                                       cv_const_sv((CV*)sref)))))
3195                                 {
3196                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3197                                         CvCONST(cv)
3198                                         ? "Constant subroutine %s::%s redefined"
3199                                         : "Subroutine %s::%s redefined",
3200                                         HvNAME_get(GvSTASH((GV*)dstr)),
3201                                         GvENAME((GV*)dstr));
3202                                 }
3203                             }
3204                             if (!intro)
3205                                 cv_ckproto(cv, (GV*)dstr,
3206                                            SvPOK(sref)
3207                                            ? SvPVX_const(sref) : Nullch);
3208                         }
3209                         GvCV(dstr) = (CV*)sref;
3210                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3211                         GvASSUMECV_on(dstr);
3212                         PL_sub_generation++;
3213                     }
3214                     if (!GvIMPORTED_CV(dstr)
3215                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3216                     {
3217                         GvIMPORTED_CV_on(dstr);
3218                     }
3219                     break;
3220                 case SVt_PVIO:
3221                     if (intro)
3222                         SAVEGENERICSV(GvIOp(dstr));
3223                     else
3224                         dref = (SV*)GvIOp(dstr);
3225                     GvIOp(dstr) = (IO*)sref;
3226                     break;
3227                 case SVt_PVFM:
3228                     if (intro)
3229                         SAVEGENERICSV(GvFORM(dstr));
3230                     else
3231                         dref = (SV*)GvFORM(dstr);
3232                     GvFORM(dstr) = (CV*)sref;
3233                     break;
3234                 default:
3235                     if (intro)
3236                         SAVEGENERICSV(GvSV(dstr));
3237                     else
3238                         dref = (SV*)GvSV(dstr);
3239                     GvSV(dstr) = sref;
3240                     if (!GvIMPORTED_SV(dstr)
3241                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3242                     {
3243                         GvIMPORTED_SV_on(dstr);
3244                     }
3245                     break;
3246                 }
3247                 if (dref)
3248                     SvREFCNT_dec(dref);
3249                 if (SvTAINTED(sstr))
3250                     SvTAINT(dstr);
3251                 return;
3252             }
3253             if (SvPVX_const(dstr)) {
3254                 SvPV_free(dstr);
3255                 SvLEN_set(dstr, 0);
3256                 SvCUR_set(dstr, 0);
3257             }
3258         }
3259         (void)SvOK_off(dstr);
3260         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3261         SvROK_on(dstr);
3262         if (sflags & SVp_NOK) {
3263             SvNOKp_on(dstr);
3264             /* Only set the public OK flag if the source has public OK.  */
3265             if (sflags & SVf_NOK)
3266                 SvFLAGS(dstr) |= SVf_NOK;
3267             SvNV_set(dstr, SvNVX(sstr));
3268         }
3269         if (sflags & SVp_IOK) {
3270             (void)SvIOKp_on(dstr);
3271             if (sflags & SVf_IOK)
3272                 SvFLAGS(dstr) |= SVf_IOK;
3273             if (sflags & SVf_IVisUV)
3274                 SvIsUV_on(dstr);
3275             SvIV_set(dstr, SvIVX(sstr));
3276         }
3277         if (SvAMAGIC(sstr)) {
3278             SvAMAGIC_on(dstr);
3279         }
3280     }
3281     else if (sflags & SVp_POK) {
3282         bool isSwipe = 0;
3283
3284         /*
3285          * Check to see if we can just swipe the string.  If so, it's a
3286          * possible small lose on short strings, but a big win on long ones.
3287          * It might even be a win on short strings if SvPVX_const(dstr)
3288          * has to be allocated and SvPVX_const(sstr) has to be freed.
3289          */
3290
3291         /* Whichever path we take through the next code, we want this true,
3292            and doing it now facilitates the COW check.  */
3293         (void)SvPOK_only(dstr);
3294
3295         if (
3296             /* We're not already COW  */
3297             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3298 #ifndef PERL_OLD_COPY_ON_WRITE
3299              /* or we are, but dstr isn't a suitable target.  */
3300              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3301 #endif
3302              )
3303             &&
3304             !(isSwipe =
3305                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3306                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3307                  (!(flags & SV_NOSTEAL)) &&
3308                                         /* and we're allowed to steal temps */
3309                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3310                  SvLEN(sstr)    &&        /* and really is a string */
3311                                 /* and won't be needed again, potentially */
3312               !(PL_op && PL_op->op_type == OP_AASSIGN))
3313 #ifdef PERL_OLD_COPY_ON_WRITE
3314             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3315                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3316                  && SvTYPE(sstr) >= SVt_PVIV)
3317 #endif
3318             ) {
3319             /* Failed the swipe test, and it's not a shared hash key either.
3320                Have to copy the string.  */
3321             STRLEN len = SvCUR(sstr);
3322             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3323             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3324             SvCUR_set(dstr, len);
3325             *SvEND(dstr) = '\0';
3326         } else {
3327             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3328                be true in here.  */
3329             /* Either it's a shared hash key, or it's suitable for
3330                copy-on-write or we can swipe the string.  */
3331             if (DEBUG_C_TEST) {
3332                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3333                 sv_dump(sstr);
3334                 sv_dump(dstr);
3335             }
3336 #ifdef PERL_OLD_COPY_ON_WRITE
3337             if (!isSwipe) {
3338                 /* I believe I should acquire a global SV mutex if
3339                    it's a COW sv (not a shared hash key) to stop
3340                    it going un copy-on-write.
3341                    If the source SV has gone un copy on write between up there
3342                    and down here, then (assert() that) it is of the correct
3343                    form to make it copy on write again */
3344                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3345                     != (SVf_FAKE | SVf_READONLY)) {
3346                     SvREADONLY_on(sstr);
3347                     SvFAKE_on(sstr);
3348                     /* Make the source SV into a loop of 1.
3349                        (about to become 2) */
3350                     SV_COW_NEXT_SV_SET(sstr, sstr);
3351                 }
3352             }
3353 #endif
3354             /* Initial code is common.  */
3355             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3356                 SvPV_free(dstr);
3357             }
3358
3359             if (!isSwipe) {
3360                 /* making another shared SV.  */
3361                 STRLEN cur = SvCUR(sstr);
3362                 STRLEN len = SvLEN(sstr);
3363 #ifdef PERL_OLD_COPY_ON_WRITE
3364                 if (len) {
3365                     assert (SvTYPE(dstr) >= SVt_PVIV);
3366                     /* SvIsCOW_normal */
3367                     /* splice us in between source and next-after-source.  */
3368                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3369                     SV_COW_NEXT_SV_SET(sstr, dstr);
3370                     SvPV_set(dstr, SvPVX_mutable(sstr));
3371                 } else
3372 #endif
3373                 {
3374                     /* SvIsCOW_shared_hash */
3375                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3376                                           "Copy on write: Sharing hash\n"));
3377
3378                     assert (SvTYPE(dstr) >= SVt_PV);
3379                     SvPV_set(dstr,
3380                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3381                 }
3382                 SvLEN_set(dstr, len);
3383                 SvCUR_set(dstr, cur);
3384                 SvREADONLY_on(dstr);
3385                 SvFAKE_on(dstr);
3386                 /* Relesase a global SV mutex.  */
3387             }
3388             else
3389                 {       /* Passes the swipe test.  */
3390                 SvPV_set(dstr, SvPVX_mutable(sstr));
3391                 SvLEN_set(dstr, SvLEN(sstr));
3392                 SvCUR_set(dstr, SvCUR(sstr));
3393
3394                 SvTEMP_off(dstr);
3395                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3396                 SvPV_set(sstr, Nullch);
3397                 SvLEN_set(sstr, 0);
3398                 SvCUR_set(sstr, 0);
3399                 SvTEMP_off(sstr);
3400             }
3401         }
3402         if (sflags & SVf_UTF8)
3403             SvUTF8_on(dstr);
3404         if (sflags & SVp_NOK) {
3405             SvNOKp_on(dstr);
3406             if (sflags & SVf_NOK)
3407                 SvFLAGS(dstr) |= SVf_NOK;
3408             SvNV_set(dstr, SvNVX(sstr));
3409         }
3410         if (sflags & SVp_IOK) {
3411             (void)SvIOKp_on(dstr);
3412             if (sflags & SVf_IOK)
3413                 SvFLAGS(dstr) |= SVf_IOK;
3414             if (sflags & SVf_IVisUV)
3415                 SvIsUV_on(dstr);
3416             SvIV_set(dstr, SvIVX(sstr));
3417         }
3418         if (SvVOK(sstr)) {
3419             const MAGIC * const smg = mg_find(sstr,PERL_MAGIC_vstring);
3420             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3421                         smg->mg_ptr, smg->mg_len);
3422             SvRMAGICAL_on(dstr);
3423         }
3424     }
3425     else if (sflags & SVp_IOK) {
3426         if (sflags & SVf_IOK)
3427             (void)SvIOK_only(dstr);
3428         else {
3429             (void)SvOK_off(dstr);
3430             (void)SvIOKp_on(dstr);
3431         }
3432         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3433         if (sflags & SVf_IVisUV)
3434             SvIsUV_on(dstr);
3435         SvIV_set(dstr, SvIVX(sstr));
3436         if (sflags & SVp_NOK) {
3437             if (sflags & SVf_NOK)
3438                 (void)SvNOK_on(dstr);
3439             else
3440                 (void)SvNOKp_on(dstr);
3441             SvNV_set(dstr, SvNVX(sstr));
3442         }
3443     }
3444     else if (sflags & SVp_NOK) {
3445         if (sflags & SVf_NOK)
3446             (void)SvNOK_only(dstr);
3447         else {
3448             (void)SvOK_off(dstr);
3449             SvNOKp_on(dstr);
3450         }
3451         SvNV_set(dstr, SvNVX(sstr));
3452     }
3453     else {
3454         if (dtype == SVt_PVGV) {
3455             if (ckWARN(WARN_MISC))
3456                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3457         }
3458         else
3459             (void)SvOK_off(dstr);
3460     }
3461     if (SvTAINTED(sstr))
3462         SvTAINT(dstr);
3463 }
3464
3465 /*
3466 =for apidoc sv_setsv_mg
3467
3468 Like C<sv_setsv>, but also handles 'set' magic.
3469
3470 =cut
3471 */
3472
3473 void
3474 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3475 {
3476     sv_setsv(dstr,sstr);
3477     SvSETMAGIC(dstr);
3478 }
3479
3480 #ifdef PERL_OLD_COPY_ON_WRITE
3481 SV *
3482 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3483 {
3484     STRLEN cur = SvCUR(sstr);
3485     STRLEN len = SvLEN(sstr);
3486     register char *new_pv;
3487
3488     if (DEBUG_C_TEST) {
3489         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3490                       sstr, dstr);
3491         sv_dump(sstr);
3492         if (dstr)
3493                     sv_dump(dstr);
3494     }
3495
3496     if (dstr) {
3497         if (SvTHINKFIRST(dstr))
3498             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3499         else if (SvPVX_const(dstr))
3500             Safefree(SvPVX_const(dstr));
3501     }
3502     else
3503         new_SV(dstr);
3504     SvUPGRADE(dstr, SVt_PVIV);
3505
3506     assert (SvPOK(sstr));
3507     assert (SvPOKp(sstr));
3508     assert (!SvIOK(sstr));
3509     assert (!SvIOKp(sstr));
3510     assert (!SvNOK(sstr));
3511     assert (!SvNOKp(sstr));
3512
3513     if (SvIsCOW(sstr)) {
3514
3515         if (SvLEN(sstr) == 0) {
3516             /* source is a COW shared hash key.  */
3517             DEBUG_C(PerlIO_printf(Perl_debug_log,
3518                                   "Fast copy on write: Sharing hash\n"));
3519             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3520             goto common_exit;
3521         }
3522         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3523     } else {
3524         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3525         SvUPGRADE(sstr, SVt_PVIV);
3526         SvREADONLY_on(sstr);
3527         SvFAKE_on(sstr);
3528         DEBUG_C(PerlIO_printf(Perl_debug_log,
3529                               "Fast copy on write: Converting sstr to COW\n"));
3530         SV_COW_NEXT_SV_SET(dstr, sstr);
3531     }
3532     SV_COW_NEXT_SV_SET(sstr, dstr);
3533     new_pv = SvPVX_mutable(sstr);
3534
3535   common_exit:
3536     SvPV_set(dstr, new_pv);
3537     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3538     if (SvUTF8(sstr))
3539         SvUTF8_on(dstr);
3540     SvLEN_set(dstr, len);
3541     SvCUR_set(dstr, cur);
3542     if (DEBUG_C_TEST) {
3543         sv_dump(dstr);
3544     }
3545     return dstr;
3546 }
3547 #endif
3548
3549 /*
3550 =for apidoc sv_setpvn
3551
3552 Copies a string into an SV.  The C<len> parameter indicates the number of
3553 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3554 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3555
3556 =cut
3557 */
3558
3559 void
3560 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3561 {
3562     dVAR;
3563     register char *dptr;
3564
3565     SV_CHECK_THINKFIRST_COW_DROP(sv);
3566     if (!ptr) {
3567         (void)SvOK_off(sv);
3568         return;
3569     }
3570     else {
3571         /* len is STRLEN which is unsigned, need to copy to signed */
3572         const IV iv = len;
3573         if (iv < 0)
3574             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3575     }
3576     SvUPGRADE(sv, SVt_PV);
3577
3578     dptr = SvGROW(sv, len + 1);
3579     Move(ptr,dptr,len,char);
3580     dptr[len] = '\0';
3581     SvCUR_set(sv, len);
3582     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3583     SvTAINT(sv);
3584 }
3585
3586 /*
3587 =for apidoc sv_setpvn_mg
3588
3589 Like C<sv_setpvn>, but also handles 'set' magic.
3590
3591 =cut
3592 */
3593
3594 void
3595 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3596 {
3597     sv_setpvn(sv,ptr,len);
3598     SvSETMAGIC(sv);
3599 }
3600
3601 /*
3602 =for apidoc sv_setpv
3603
3604 Copies a string into an SV.  The string must be null-terminated.  Does not
3605 handle 'set' magic.  See C<sv_setpv_mg>.
3606
3607 =cut
3608 */
3609
3610 void
3611 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3612 {
3613     dVAR;
3614     register STRLEN len;
3615
3616     SV_CHECK_THINKFIRST_COW_DROP(sv);
3617     if (!ptr) {
3618         (void)SvOK_off(sv);
3619         return;
3620     }
3621     len = strlen(ptr);
3622     SvUPGRADE(sv, SVt_PV);
3623
3624     SvGROW(sv, len + 1);
3625     Move(ptr,SvPVX(sv),len+1,char);
3626     SvCUR_set(sv, len);
3627     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3628     SvTAINT(sv);
3629 }
3630
3631 /*
3632 =for apidoc sv_setpv_mg
3633
3634 Like C<sv_setpv>, but also handles 'set' magic.
3635
3636 =cut
3637 */
3638
3639 void
3640 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3641 {
3642     sv_setpv(sv,ptr);
3643     SvSETMAGIC(sv);
3644 }
3645
3646 /*
3647 =for apidoc sv_usepvn
3648
3649 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3650 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3651 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3652 string length, C<len>, must be supplied.  This function will realloc the
3653 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3654 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3655 See C<sv_usepvn_mg>.
3656
3657 =cut
3658 */
3659
3660 void
3661 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3662 {
3663     dVAR;
3664     STRLEN allocate;
3665     SV_CHECK_THINKFIRST_COW_DROP(sv);
3666     SvUPGRADE(sv, SVt_PV);
3667     if (!ptr) {
3668         (void)SvOK_off(sv);
3669         return;
3670     }
3671     if (SvPVX_const(sv))
3672         SvPV_free(sv);
3673
3674     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3675     ptr = saferealloc (ptr, allocate);
3676     SvPV_set(sv, ptr);
3677     SvCUR_set(sv, len);
3678     SvLEN_set(sv, allocate);
3679     *SvEND(sv) = '\0';
3680     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3681     SvTAINT(sv);
3682 }
3683
3684 /*
3685 =for apidoc sv_usepvn_mg
3686
3687 Like C<sv_usepvn>, but also handles 'set' magic.
3688
3689 =cut
3690 */
3691
3692 void
3693 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3694 {
3695     sv_usepvn(sv,ptr,len);
3696     SvSETMAGIC(sv);
3697 }
3698
3699 #ifdef PERL_OLD_COPY_ON_WRITE
3700 /* Need to do this *after* making the SV normal, as we need the buffer
3701    pointer to remain valid until after we've copied it.  If we let go too early,
3702    another thread could invalidate it by unsharing last of the same hash key
3703    (which it can do by means other than releasing copy-on-write Svs)
3704    or by changing the other copy-on-write SVs in the loop.  */
3705 STATIC void
3706 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3707 {
3708     if (len) { /* this SV was SvIsCOW_normal(sv) */
3709          /* we need to find the SV pointing to us.  */
3710         SV * const current = SV_COW_NEXT_SV(after);
3711
3712         if (current == sv) {
3713             /* The SV we point to points back to us (there were only two of us
3714                in the loop.)
3715                Hence other SV is no longer copy on write either.  */
3716             SvFAKE_off(after);
3717             SvREADONLY_off(after);
3718         } else {
3719             /* We need to follow the pointers around the loop.  */
3720             SV *next;
3721             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3722                 assert (next);
3723                 current = next;
3724                  /* don't loop forever if the structure is bust, and we have
3725                     a pointer into a closed loop.  */
3726                 assert (current != after);
3727                 assert (SvPVX_const(current) == pvx);
3728             }
3729             /* Make the SV before us point to the SV after us.  */
3730             SV_COW_NEXT_SV_SET(current, after);
3731         }
3732     } else {
3733         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3734     }
3735 }
3736
3737 int
3738 Perl_sv_release_IVX(pTHX_ register SV *sv)
3739 {
3740     if (SvIsCOW(sv))
3741         sv_force_normal_flags(sv, 0);
3742     SvOOK_off(sv);
3743     return 0;
3744 }
3745 #endif
3746 /*
3747 =for apidoc sv_force_normal_flags
3748
3749 Undo various types of fakery on an SV: if the PV is a shared string, make
3750 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3751 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3752 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3753 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3754 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3755 set to some other value.) In addition, the C<flags> parameter gets passed to
3756 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3757 with flags set to 0.
3758
3759 =cut
3760 */
3761
3762 void
3763 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3764 {
3765     dVAR;
3766 #ifdef PERL_OLD_COPY_ON_WRITE
3767     if (SvREADONLY(sv)) {
3768         /* At this point I believe I should acquire a global SV mutex.  */
3769         if (SvFAKE(sv)) {
3770             const char * const pvx = SvPVX_const(sv);
3771             const STRLEN len = SvLEN(sv);
3772             const STRLEN cur = SvCUR(sv);
3773             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3774             if (DEBUG_C_TEST) {
3775                 PerlIO_printf(Perl_debug_log,
3776                               "Copy on write: Force normal %ld\n",
3777                               (long) flags);
3778                 sv_dump(sv);
3779             }
3780             SvFAKE_off(sv);
3781             SvREADONLY_off(sv);
3782             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3783             SvPV_set(sv, (char*)0);
3784             SvLEN_set(sv, 0);
3785             if (flags & SV_COW_DROP_PV) {
3786                 /* OK, so we don't need to copy our buffer.  */
3787                 SvPOK_off(sv);
3788             } else {
3789                 SvGROW(sv, cur + 1);
3790                 Move(pvx,SvPVX(sv),cur,char);
3791                 SvCUR_set(sv, cur);
3792                 *SvEND(sv) = '\0';
3793             }
3794             sv_release_COW(sv, pvx, len, next);
3795             if (DEBUG_C_TEST) {
3796                 sv_dump(sv);
3797             }
3798         }
3799         else if (IN_PERL_RUNTIME)
3800             Perl_croak(aTHX_ PL_no_modify);
3801         /* At this point I believe that I can drop the global SV mutex.  */
3802     }
3803 #else
3804     if (SvREADONLY(sv)) {
3805         if (SvFAKE(sv)) {
3806             const char * const pvx = SvPVX_const(sv);
3807             const STRLEN len = SvCUR(sv);
3808             SvFAKE_off(sv);
3809             SvREADONLY_off(sv);
3810             SvPV_set(sv, Nullch);
3811             SvLEN_set(sv, 0);
3812             SvGROW(sv, len + 1);
3813             Move(pvx,SvPVX(sv),len,char);
3814             *SvEND(sv) = '\0';
3815             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3816         }
3817         else if (IN_PERL_RUNTIME)
3818             Perl_croak(aTHX_ PL_no_modify);
3819     }
3820 #endif
3821     if (SvROK(sv))
3822         sv_unref_flags(sv, flags);
3823     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
3824         sv_unglob(sv);
3825 }
3826
3827 /*
3828 =for apidoc sv_chop
3829
3830 Efficient removal of characters from the beginning of the string buffer.
3831 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
3832 the string buffer.  The C<ptr> becomes the first character of the adjusted
3833 string. Uses the "OOK hack".
3834 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
3835 refer to the same chunk of data.
3836
3837 =cut
3838 */
3839
3840 void
3841 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
3842 {
3843     register STRLEN delta;
3844     if (!ptr || !SvPOKp(sv))
3845         return;
3846     delta = ptr - SvPVX_const(sv);
3847     SV_CHECK_THINKFIRST(sv);
3848     if (SvTYPE(sv) < SVt_PVIV)
3849         sv_upgrade(sv,SVt_PVIV);
3850
3851     if (!SvOOK(sv)) {
3852         if (!SvLEN(sv)) { /* make copy of shared string */
3853             const char *pvx = SvPVX_const(sv);
3854             const STRLEN len = SvCUR(sv);
3855             SvGROW(sv, len + 1);
3856             Move(pvx,SvPVX(sv),len,char);
3857             *SvEND(sv) = '\0';
3858         }
3859         SvIV_set(sv, 0);
3860         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
3861            and we do that anyway inside the SvNIOK_off
3862         */
3863         SvFLAGS(sv) |= SVf_OOK;
3864     }
3865     SvNIOK_off(sv);
3866     SvLEN_set(sv, SvLEN(sv) - delta);
3867     SvCUR_set(sv, SvCUR(sv) - delta);
3868     SvPV_set(sv, SvPVX(sv) + delta);
3869     SvIV_set(sv, SvIVX(sv) + delta);
3870 }
3871
3872 /*
3873 =for apidoc sv_catpvn
3874
3875 Concatenates the string onto the end of the string which is in the SV.  The
3876 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3877 status set, then the bytes appended should be valid UTF-8.
3878 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
3879
3880 =for apidoc sv_catpvn_flags
3881
3882 Concatenates the string onto the end of the string which is in the SV.  The
3883 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3884 status set, then the bytes appended should be valid UTF-8.
3885 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
3886 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
3887 in terms of this function.
3888
3889 =cut
3890 */
3891
3892 void
3893 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
3894 {
3895     dVAR;
3896     STRLEN dlen;
3897     const char * const dstr = SvPV_force_flags(dsv, dlen, flags);
3898
3899     SvGROW(dsv, dlen + slen + 1);
3900     if (sstr == dstr)
3901         sstr = SvPVX_const(dsv);
3902     Move(sstr, SvPVX(dsv) + dlen, slen, char);
3903     SvCUR_set(dsv, SvCUR(dsv) + slen);
3904     *SvEND(dsv) = '\0';
3905     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
3906     SvTAINT(dsv);
3907     if (flags & SV_SMAGIC)
3908         SvSETMAGIC(dsv);
3909 }
3910
3911 /*
3912 =for apidoc sv_catsv
3913
3914 Concatenates the string from SV C<ssv> onto the end of the string in
3915 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
3916 not 'set' magic.  See C<sv_catsv_mg>.
3917
3918 =for apidoc sv_catsv_flags
3919
3920 Concatenates the string from SV C<ssv> onto the end of the string in
3921 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
3922 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
3923 and C<sv_catsv_nomg> are implemented in terms of this function.
3924
3925 =cut */
3926
3927 void
3928 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
3929 {
3930     dVAR;
3931     if (ssv) {
3932         STRLEN slen;
3933         const char *spv = SvPV_const(ssv, slen);
3934         if (spv) {
3935             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
3936                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
3937                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
3938                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
3939                 dsv->sv_flags doesn't have that bit set.
3940                 Andy Dougherty  12 Oct 2001
3941             */
3942             const I32 sutf8 = DO_UTF8(ssv);
3943             I32 dutf8;
3944
3945             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
3946                 mg_get(dsv);
3947             dutf8 = DO_UTF8(dsv);
3948
3949             if (dutf8 != sutf8) {
3950                 if (dutf8) {
3951                     /* Not modifying source SV, so taking a temporary copy. */
3952                     SV* const csv = sv_2mortal(newSVpvn(spv, slen));
3953
3954                     sv_utf8_upgrade(csv);
3955                     spv = SvPV_const(csv, slen);
3956                 }
3957                 else
3958                     sv_utf8_upgrade_nomg(dsv);
3959             }
3960             sv_catpvn_nomg(dsv, spv, slen);
3961         }
3962     }
3963     if (flags & SV_SMAGIC)
3964         SvSETMAGIC(dsv);
3965 }
3966
3967 /*
3968 =for apidoc sv_catpv
3969
3970 Concatenates the string onto the end of the string which is in the SV.
3971 If the SV has the UTF-8 status set, then the bytes appended should be
3972 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
3973
3974 =cut */
3975
3976 void
3977 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
3978 {
3979     dVAR;
3980     register STRLEN len;
3981     STRLEN tlen;
3982     char *junk;
3983
3984     if (!ptr)
3985         return;
3986     junk = SvPV_force(sv, tlen);
3987     len = strlen(ptr);
3988     SvGROW(sv, tlen + len + 1);
3989     if (ptr == junk)
3990         ptr = SvPVX_const(sv);
3991     Move(ptr,SvPVX(sv)+tlen,len+1,char);
3992     SvCUR_set(sv, SvCUR(sv) + len);
3993     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3994     SvTAINT(sv);
3995 }
3996
3997 /*
3998 =for apidoc sv_catpv_mg
3999
4000 Like C<sv_catpv>, but also handles 'set' magic.
4001
4002 =cut
4003 */
4004
4005 void
4006 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
4007 {
4008     sv_catpv(sv,ptr);
4009     SvSETMAGIC(sv);
4010 }
4011
4012 /*
4013 =for apidoc newSV
4014
4015 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
4016 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
4017 macro.
4018
4019 =cut
4020 */
4021
4022 SV *
4023 Perl_newSV(pTHX_ STRLEN len)
4024 {
4025     dVAR;
4026     register SV *sv;
4027
4028     new_SV(sv);
4029     if (len) {
4030         sv_upgrade(sv, SVt_PV);
4031         SvGROW(sv, len + 1);
4032     }
4033     return sv;
4034 }
4035 /*
4036 =for apidoc sv_magicext
4037
4038 Adds magic to an SV, upgrading it if necessary. Applies the
4039 supplied vtable and returns a pointer to the magic added.
4040
4041 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4042 In particular, you can add magic to SvREADONLY SVs, and add more than
4043 one instance of the same 'how'.
4044
4045 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4046 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4047 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4048 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4049
4050 (This is now used as a subroutine by C<sv_magic>.)
4051
4052 =cut
4053 */
4054 MAGIC * 
4055 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4056                  const char* name, I32 namlen)
4057 {
4058     dVAR;
4059     MAGIC* mg;
4060
4061     if (SvTYPE(sv) < SVt_PVMG) {
4062         SvUPGRADE(sv, SVt_PVMG);
4063     }
4064     Newxz(mg, 1, MAGIC);
4065     mg->mg_moremagic = SvMAGIC(sv);
4066     SvMAGIC_set(sv, mg);
4067
4068     /* Sometimes a magic contains a reference loop, where the sv and
4069        object refer to each other.  To prevent a reference loop that
4070        would prevent such objects being freed, we look for such loops
4071        and if we find one we avoid incrementing the object refcount.
4072
4073        Note we cannot do this to avoid self-tie loops as intervening RV must
4074        have its REFCNT incremented to keep it in existence.
4075
4076     */
4077     if (!obj || obj == sv ||
4078         how == PERL_MAGIC_arylen ||
4079         how == PERL_MAGIC_qr ||
4080         how == PERL_MAGIC_symtab ||
4081         (SvTYPE(obj) == SVt_PVGV &&
4082             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4083             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4084             GvFORM(obj) == (CV*)sv)))
4085     {
4086         mg->mg_obj = obj;
4087     }
4088     else {
4089         mg->mg_obj = SvREFCNT_inc(obj);
4090         mg->mg_flags |= MGf_REFCOUNTED;
4091     }
4092
4093     /* Normal self-ties simply pass a null object, and instead of
4094        using mg_obj directly, use the SvTIED_obj macro to produce a
4095        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4096        with an RV obj pointing to the glob containing the PVIO.  In
4097        this case, to avoid a reference loop, we need to weaken the
4098        reference.
4099     */
4100
4101     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4102         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4103     {
4104       sv_rvweaken(obj);
4105     }
4106
4107     mg->mg_type = how;
4108     mg->mg_len = namlen;
4109     if (name) {
4110         if (namlen > 0)
4111             mg->mg_ptr = savepvn(name, namlen);
4112         else if (namlen == HEf_SVKEY)
4113             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4114         else
4115             mg->mg_ptr = (char *) name;
4116     }
4117     mg->mg_virtual = vtable;
4118
4119     mg_magical(sv);
4120     if (SvGMAGICAL(sv))
4121         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4122     return mg;
4123 }
4124
4125 /*
4126 =for apidoc sv_magic
4127
4128 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4129 then adds a new magic item of type C<how> to the head of the magic list.
4130
4131 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4132 handling of the C<name> and C<namlen> arguments.
4133
4134 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4135 to add more than one instance of the same 'how'.
4136
4137 =cut
4138 */
4139
4140 void
4141 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4142 {
4143     dVAR;
4144     const MGVTBL *vtable;
4145     MAGIC* mg;
4146
4147 #ifdef PERL_OLD_COPY_ON_WRITE
4148     if (SvIsCOW(sv))
4149         sv_force_normal_flags(sv, 0);
4150 #endif
4151     if (SvREADONLY(sv)) {
4152         if (
4153             /* its okay to attach magic to shared strings; the subsequent
4154              * upgrade to PVMG will unshare the string */
4155             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4156
4157             && IN_PERL_RUNTIME
4158             && how != PERL_MAGIC_regex_global
4159             && how != PERL_MAGIC_bm
4160             && how != PERL_MAGIC_fm
4161             && how != PERL_MAGIC_sv
4162             && how != PERL_MAGIC_backref
4163            )
4164         {
4165             Perl_croak(aTHX_ PL_no_modify);
4166         }
4167     }
4168     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4169         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4170             /* sv_magic() refuses to add a magic of the same 'how' as an
4171                existing one
4172              */
4173             if (how == PERL_MAGIC_taint)
4174                 mg->mg_len |= 1;
4175             return;
4176         }
4177     }
4178
4179     switch (how) {
4180     case PERL_MAGIC_sv:
4181         vtable = &PL_vtbl_sv;
4182         break;
4183     case PERL_MAGIC_overload:
4184         vtable = &PL_vtbl_amagic;
4185         break;
4186     case PERL_MAGIC_overload_elem:
4187         vtable = &PL_vtbl_amagicelem;
4188         break;
4189     case PERL_MAGIC_overload_table:
4190         vtable = &PL_vtbl_ovrld;
4191         break;
4192     case PERL_MAGIC_bm:
4193         vtable = &PL_vtbl_bm;
4194         break;
4195     case PERL_MAGIC_regdata:
4196         vtable = &PL_vtbl_regdata;
4197         break;
4198     case PERL_MAGIC_regdatum:
4199         vtable = &PL_vtbl_regdatum;
4200         break;
4201     case PERL_MAGIC_env:
4202         vtable = &PL_vtbl_env;
4203         break;
4204     case PERL_MAGIC_fm:
4205         vtable = &PL_vtbl_fm;
4206         break;
4207     case PERL_MAGIC_envelem:
4208         vtable = &PL_vtbl_envelem;
4209         break;
4210     case PERL_MAGIC_regex_global:
4211         vtable = &PL_vtbl_mglob;
4212         break;
4213     case PERL_MAGIC_isa:
4214         vtable = &PL_vtbl_isa;
4215         break;
4216     case PERL_MAGIC_isaelem:
4217         vtable = &PL_vtbl_isaelem;
4218         break;
4219     case PERL_MAGIC_nkeys:
4220         vtable = &PL_vtbl_nkeys;
4221         break;
4222     case PERL_MAGIC_dbfile:
4223         vtable = NULL;
4224         break;
4225     case PERL_MAGIC_dbline:
4226         vtable = &PL_vtbl_dbline;
4227         break;
4228 #ifdef USE_LOCALE_COLLATE
4229     case PERL_MAGIC_collxfrm:
4230         vtable = &PL_vtbl_collxfrm;
4231         break;
4232 #endif /* USE_LOCALE_COLLATE */
4233     case PERL_MAGIC_tied:
4234         vtable = &PL_vtbl_pack;
4235         break;
4236     case PERL_MAGIC_tiedelem:
4237     case PERL_MAGIC_tiedscalar:
4238         vtable = &PL_vtbl_packelem;
4239         break;
4240     case PERL_MAGIC_qr:
4241         vtable = &PL_vtbl_regexp;
4242         break;
4243     case PERL_MAGIC_sig:
4244         vtable = &PL_vtbl_sig;
4245         break;
4246     case PERL_MAGIC_sigelem:
4247         vtable = &PL_vtbl_sigelem;
4248         break;
4249     case PERL_MAGIC_taint:
4250         vtable = &PL_vtbl_taint;
4251         break;
4252     case PERL_MAGIC_uvar:
4253         vtable = &PL_vtbl_uvar;
4254         break;
4255     case PERL_MAGIC_vec:
4256         vtable = &PL_vtbl_vec;
4257         break;
4258     case PERL_MAGIC_arylen_p:
4259     case PERL_MAGIC_rhash:
4260     case PERL_MAGIC_symtab:
4261     case PERL_MAGIC_vstring:
4262         vtable = NULL;
4263         break;
4264     case PERL_MAGIC_utf8:
4265         vtable = &PL_vtbl_utf8;
4266         break;
4267     case PERL_MAGIC_substr:
4268         vtable = &PL_vtbl_substr;
4269         break;
4270     case PERL_MAGIC_defelem:
4271         vtable = &PL_vtbl_defelem;
4272         break;
4273     case PERL_MAGIC_glob:
4274         vtable = &PL_vtbl_glob;
4275         break;
4276     case PERL_MAGIC_arylen:
4277         vtable = &PL_vtbl_arylen;
4278         break;
4279     case PERL_MAGIC_pos:
4280         vtable = &PL_vtbl_pos;
4281         break;
4282     case PERL_MAGIC_backref:
4283         vtable = &PL_vtbl_backref;
4284         break;
4285     case PERL_MAGIC_ext:
4286         /* Reserved for use by extensions not perl internals.           */
4287         /* Useful for attaching extension internal data to perl vars.   */
4288         /* Note that multiple extensions may clash if magical scalars   */
4289         /* etc holding private data from one are passed to another.     */
4290         vtable = NULL;
4291         break;
4292     default:
4293         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4294     }
4295
4296     /* Rest of work is done else where */
4297     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4298
4299     switch (how) {
4300     case PERL_MAGIC_taint:
4301         mg->mg_len = 1;
4302         break;
4303     case PERL_MAGIC_ext:
4304     case PERL_MAGIC_dbfile:
4305         SvRMAGICAL_on(sv);
4306         break;
4307     }
4308 }
4309
4310 /*
4311 =for apidoc sv_unmagic
4312
4313 Removes all magic of type C<type> from an SV.
4314
4315 =cut
4316 */
4317
4318 int
4319 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4320 {
4321     MAGIC* mg;
4322     MAGIC** mgp;
4323     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4324         return 0;
4325     mgp = &SvMAGIC(sv);
4326     for (mg = *mgp; mg; mg = *mgp) {
4327         if (mg->mg_type == type) {
4328             const MGVTBL* const vtbl = mg->mg_virtual;
4329             *mgp = mg->mg_moremagic;
4330             if (vtbl && vtbl->svt_free)
4331                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4332             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4333                 if (mg->mg_len > 0)
4334                     Safefree(mg->mg_ptr);
4335                 else if (mg->mg_len == HEf_SVKEY)
4336                     SvREFCNT_dec((SV*)mg->mg_ptr);
4337                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4338                     Safefree(mg->mg_ptr);
4339             }
4340             if (mg->mg_flags & MGf_REFCOUNTED)
4341                 SvREFCNT_dec(mg->mg_obj);
4342             Safefree(mg);
4343         }
4344         else
4345             mgp = &mg->mg_moremagic;
4346     }
4347     if (!SvMAGIC(sv)) {
4348         SvMAGICAL_off(sv);
4349         SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4350         SvMAGIC_set(sv, NULL);
4351     }
4352
4353     return 0;
4354 }
4355
4356 /*
4357 =for apidoc sv_rvweaken
4358
4359 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4360 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4361 push a back-reference to this RV onto the array of backreferences
4362 associated with that magic.
4363
4364 =cut
4365 */
4366
4367 SV *
4368 Perl_sv_rvweaken(pTHX_ SV *sv)
4369 {
4370     SV *tsv;
4371     if (!SvOK(sv))  /* let undefs pass */
4372         return sv;
4373     if (!SvROK(sv))
4374         Perl_croak(aTHX_ "Can't weaken a nonreference");
4375     else if (SvWEAKREF(sv)) {
4376         if (ckWARN(WARN_MISC))
4377             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4378         return sv;
4379     }
4380     tsv = SvRV(sv);
4381     Perl_sv_add_backref(aTHX_ tsv, sv);
4382     SvWEAKREF_on(sv);
4383     SvREFCNT_dec(tsv);
4384     return sv;
4385 }
4386
4387 /* Give tsv backref magic if it hasn't already got it, then push a
4388  * back-reference to sv onto the array associated with the backref magic.
4389  */
4390
4391 void
4392 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4393 {
4394     dVAR;
4395     AV *av;
4396
4397     if (SvTYPE(tsv) == SVt_PVHV) {
4398         AV **const avp = Perl_hv_backreferences_p(aTHX_ (HV*)tsv);
4399
4400         av = *avp;
4401         if (!av) {
4402             /* There is no AV in the offical place - try a fixup.  */
4403             MAGIC *const mg = mg_find(tsv, PERL_MAGIC_backref);
4404
4405             if (mg) {
4406                 /* Aha. They've got it stowed in magic.  Bring it back.  */
4407                 av = (AV*)mg->mg_obj;
4408                 /* Stop mg_free decreasing the refernce count.  */
4409                 mg->mg_obj = NULL;
4410                 /* Stop mg_free even calling the destructor, given that
4411                    there's no AV to free up.  */
4412                 mg->mg_virtual = 0;
4413                 sv_unmagic(tsv, PERL_MAGIC_backref);
4414             } else {
4415                 av = newAV();
4416                 AvREAL_off(av);
4417                 SvREFCNT_inc(av);
4418             }
4419             *avp = av;
4420         }
4421     } else {
4422         const MAGIC *const mg
4423             = SvMAGICAL(tsv) ? mg_find(tsv, PERL_MAGIC_backref) : NULL;
4424         if (mg)
4425             av = (AV*)mg->mg_obj;
4426         else {
4427             av = newAV();
4428             AvREAL_off(av);
4429             sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4430             /* av now has a refcnt of 2, which avoids it getting freed
4431              * before us during global cleanup. The extra ref is removed
4432              * by magic_killbackrefs() when tsv is being freed */
4433         }
4434     }
4435     if (AvFILLp(av) >= AvMAX(av)) {
4436         av_extend(av, AvFILLp(av)+1);
4437     }
4438     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4439 }
4440
4441 /* delete a back-reference to ourselves from the backref magic associated
4442  * with the SV we point to.
4443  */
4444
4445 STATIC void
4446 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4447 {
4448     dVAR;
4449     AV *av = NULL;
4450     SV **svp;
4451     I32 i;
4452
4453     if (SvTYPE(tsv) == SVt_PVHV && SvOOK(tsv)) {
4454         av = *Perl_hv_backreferences_p(aTHX_ (HV*)tsv);
4455         /* We mustn't attempt to "fix up" the hash here by moving the
4456            backreference array back to the hv_aux structure, as that is stored
4457            in the main HvARRAY(), and hfreentries assumes that no-one
4458            reallocates HvARRAY() while it is running.  */
4459     }
4460     if (!av) {
4461         const MAGIC *const mg
4462             = SvMAGICAL(tsv) ? mg_find(tsv, PERL_MAGIC_backref) : NULL;
4463         if (mg)
4464             av = (AV *)mg->mg_obj;
4465     }
4466     if (!av) {
4467         if (PL_in_clean_all)
4468             return;
4469         Perl_croak(aTHX_ "panic: del_backref");
4470     }
4471
4472     if (SvIS_FREED(av))
4473         return;
4474
4475     svp = AvARRAY(av);
4476     /* We shouldn't be in here more than once, but for paranoia reasons lets
4477        not assume this.  */
4478     for (i = AvFILLp(av); i >= 0; i--) {
4479         if (svp[i] == sv) {
4480             const SSize_t fill = AvFILLp(av);
4481             if (i != fill) {
4482                 /* We weren't the last entry.
4483                    An unordered list has this property that you can take the
4484                    last element off the end to fill the hole, and it's still
4485                    an unordered list :-)
4486                 */
4487                 svp[i] = svp[fill];
4488             }
4489             svp[fill] = Nullsv;
4490             AvFILLp(av) = fill - 1;
4491         }
4492     }
4493 }
4494
4495 int
4496 Perl_sv_kill_backrefs(pTHX_ SV *sv, AV *av)
4497 {
4498     SV **svp = AvARRAY(av);
4499
4500     PERL_UNUSED_ARG(sv);
4501
4502     /* Not sure why the av can get freed ahead of its sv, but somehow it does
4503        in ext/B/t/bytecode.t test 15 (involving print <DATA>)  */
4504     if (svp && !SvIS_FREED(av)) {
4505         SV *const *const last = svp + AvFILLp(av);
4506
4507         while (svp <= last) {
4508             if (*svp) {
4509                 SV *const referrer = *svp;
4510                 if (SvWEAKREF(referrer)) {
4511                     /* XXX Should we check that it hasn't changed? */
4512                     SvRV_set(referrer, 0);
4513                     SvOK_off(referrer);
4514                     SvWEAKREF_off(referrer);
4515                 } else if (SvTYPE(referrer) == SVt_PVGV ||
4516                            SvTYPE(referrer) == SVt_PVLV) {
4517                     /* You lookin' at me?  */
4518                     assert(GvSTASH(referrer));
4519                     assert(GvSTASH(referrer) == (HV*)sv);
4520                     GvSTASH(referrer) = 0;
4521                 } else {
4522                     Perl_croak(aTHX_
4523                                "panic: magic_killbackrefs (flags=%"UVxf")",
4524                                (UV)SvFLAGS(referrer));
4525                 }
4526
4527                 *svp = Nullsv;
4528             }
4529             svp++;
4530         }
4531     }
4532     SvREFCNT_dec(av); /* remove extra count added by sv_add_backref() */
4533     return 0;
4534 }
4535
4536 /*
4537 =for apidoc sv_insert
4538
4539 Inserts a string at the specified offset/length within the SV. Similar to
4540 the Perl substr() function.
4541
4542 =cut
4543 */
4544
4545 void
4546 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4547 {
4548     dVAR;
4549     register char *big;
4550     register char *mid;
4551     register char *midend;
4552     register char *bigend;
4553     register I32 i;
4554     STRLEN curlen;
4555
4556
4557     if (!bigstr)
4558         Perl_croak(aTHX_ "Can't modify non-existent substring");
4559     SvPV_force(bigstr, curlen);
4560     (void)SvPOK_only_UTF8(bigstr);
4561     if (offset + len > curlen) {
4562         SvGROW(bigstr, offset+len+1);
4563         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4564         SvCUR_set(bigstr, offset+len);
4565     }
4566
4567     SvTAINT(bigstr);
4568     i = littlelen - len;
4569     if (i > 0) {                        /* string might grow */
4570         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4571         mid = big + offset + len;
4572         midend = bigend = big + SvCUR(bigstr);
4573         bigend += i;
4574         *bigend = '\0';
4575         while (midend > mid)            /* shove everything down */
4576             *--bigend = *--midend;
4577         Move(little,big+offset,littlelen,char);
4578         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4579         SvSETMAGIC(bigstr);
4580         return;
4581     }
4582     else if (i == 0) {
4583         Move(little,SvPVX(bigstr)+offset,len,char);
4584         SvSETMAGIC(bigstr);
4585         return;
4586     }
4587
4588     big = SvPVX(bigstr);
4589     mid = big + offset;
4590     midend = mid + len;
4591     bigend = big + SvCUR(bigstr);
4592
4593     if (midend > bigend)
4594         Perl_croak(aTHX_ "panic: sv_insert");
4595
4596     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4597         if (littlelen) {
4598             Move(little, mid, littlelen,char);
4599             mid += littlelen;
4600         }
4601         i = bigend - midend;
4602         if (i > 0) {
4603             Move(midend, mid, i,char);
4604             mid += i;
4605         }
4606         *mid = '\0';
4607         SvCUR_set(bigstr, mid - big);
4608     }
4609     else if ((i = mid - big)) { /* faster from front */
4610         midend -= littlelen;
4611         mid = midend;
4612         sv_chop(bigstr,midend-i);
4613         big += i;
4614         while (i--)
4615             *--midend = *--big;
4616         if (littlelen)
4617             Move(little, mid, littlelen,char);
4618     }
4619     else if (littlelen) {
4620         midend -= littlelen;
4621         sv_chop(bigstr,midend);
4622         Move(little,midend,littlelen,char);
4623     }
4624     else {
4625         sv_chop(bigstr,midend);
4626     }
4627     SvSETMAGIC(bigstr);
4628 }
4629
4630 /*
4631 =for apidoc sv_replace
4632
4633 Make the first argument a copy of the second, then delete the original.
4634 The target SV physically takes over ownership of the body of the source SV
4635 and inherits its flags; however, the target keeps any magic it owns,
4636 and any magic in the source is discarded.
4637 Note that this is a rather specialist SV copying operation; most of the
4638 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4639
4640 =cut
4641 */
4642
4643 void
4644 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4645 {
4646     dVAR;
4647     const U32 refcnt = SvREFCNT(sv);
4648     SV_CHECK_THINKFIRST_COW_DROP(sv);
4649     if (SvREFCNT(nsv) != 1) {
4650         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4651                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4652     }
4653     if (SvMAGICAL(sv)) {
4654         if (SvMAGICAL(nsv))
4655             mg_free(nsv);
4656         else
4657             sv_upgrade(nsv, SVt_PVMG);
4658         SvMAGIC_set(nsv, SvMAGIC(sv));
4659         SvFLAGS(nsv) |= SvMAGICAL(sv);
4660         SvMAGICAL_off(sv);
4661         SvMAGIC_set(sv, NULL);
4662     }
4663     SvREFCNT(sv) = 0;
4664     sv_clear(sv);
4665     assert(!SvREFCNT(sv));
4666 #ifdef DEBUG_LEAKING_SCALARS
4667     sv->sv_flags  = nsv->sv_flags;
4668     sv->sv_any    = nsv->sv_any;
4669     sv->sv_refcnt = nsv->sv_refcnt;
4670     sv->sv_u      = nsv->sv_u;
4671 #else
4672     StructCopy(nsv,sv,SV);
4673 #endif
4674     /* Currently could join these into one piece of pointer arithmetic, but
4675        it would be unclear.  */
4676     if(SvTYPE(sv) == SVt_IV)
4677         SvANY(sv)
4678             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4679     else if (SvTYPE(sv) == SVt_RV) {
4680         SvANY(sv) = &sv->sv_u.svu_rv;
4681     }
4682         
4683
4684 #ifdef PERL_OLD_COPY_ON_WRITE
4685     if (SvIsCOW_normal(nsv)) {
4686         /* We need to follow the pointers around the loop to make the
4687            previous SV point to sv, rather than nsv.  */
4688         SV *next;
4689         SV *current = nsv;
4690         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4691             assert(next);
4692             current = next;
4693             assert(SvPVX_const(current) == SvPVX_const(nsv));
4694         }
4695         /* Make the SV before us point to the SV after us.  */
4696         if (DEBUG_C_TEST) {
4697             PerlIO_printf(Perl_debug_log, "previous is\n");
4698             sv_dump(current);
4699             PerlIO_printf(Perl_debug_log,
4700                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4701                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4702         }
4703         SV_COW_NEXT_SV_SET(current, sv);
4704     }
4705 #endif
4706     SvREFCNT(sv) = refcnt;
4707     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4708     SvREFCNT(nsv) = 0;
4709     del_SV(nsv);
4710 }
4711
4712 /*
4713 =for apidoc sv_clear
4714
4715 Clear an SV: call any destructors, free up any memory used by the body,
4716 and free the body itself. The SV's head is I<not> freed, although
4717 its type is set to all 1's so that it won't inadvertently be assumed
4718 to be live during global destruction etc.
4719 This function should only be called when REFCNT is zero. Most of the time
4720 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4721 instead.
4722
4723 =cut
4724 */
4725
4726 void
4727 Perl_sv_clear(pTHX_ register SV *sv)
4728 {
4729     dVAR;
4730     const U32 type = SvTYPE(sv);
4731     const struct body_details *const sv_type_details
4732         = bodies_by_type + type;
4733
4734     assert(sv);
4735     assert(SvREFCNT(sv) == 0);
4736
4737     if (type <= SVt_IV)
4738         return;
4739
4740     if (SvOBJECT(sv)) {
4741         if (PL_defstash) {              /* Still have a symbol table? */
4742             dSP;
4743             HV* stash;
4744             do {        
4745                 CV* destructor;
4746                 stash = SvSTASH(sv);
4747                 destructor = StashHANDLER(stash,DESTROY);
4748                 if (destructor) {
4749                     SV* const tmpref = newRV(sv);
4750                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4751                     ENTER;
4752                     PUSHSTACKi(PERLSI_DESTROY);
4753                     EXTEND(SP, 2);
4754                     PUSHMARK(SP);
4755                     PUSHs(tmpref);
4756                     PUTBACK;
4757                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4758                 
4759                 
4760                     POPSTACK;
4761                     SPAGAIN;
4762                     LEAVE;
4763                     if(SvREFCNT(tmpref) < 2) {
4764                         /* tmpref is not kept alive! */
4765                         SvREFCNT(sv)--;
4766                         SvRV_set(tmpref, NULL);
4767                         SvROK_off(tmpref);
4768                     }
4769                     SvREFCNT_dec(tmpref);
4770                 }
4771             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4772
4773
4774             if (SvREFCNT(sv)) {
4775                 if (PL_in_clean_objs)
4776                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4777                           HvNAME_get(stash));
4778                 /* DESTROY gave object new lease on life */
4779                 return;
4780             }
4781         }
4782
4783         if (SvOBJECT(sv)) {
4784             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4785             SvOBJECT_off(sv);   /* Curse the object. */
4786             if (type != SVt_PVIO)
4787                 --PL_sv_objcount;       /* XXX Might want something more general */
4788         }
4789     }
4790     if (type >= SVt_PVMG) {
4791         if (SvMAGIC(sv))
4792             mg_free(sv);
4793         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4794             SvREFCNT_dec(SvSTASH(sv));
4795     }
4796     switch (type) {
4797     case SVt_PVIO:
4798         if (IoIFP(sv) &&
4799             IoIFP(sv) != PerlIO_stdin() &&
4800             IoIFP(sv) != PerlIO_stdout() &&
4801             IoIFP(sv) != PerlIO_stderr())
4802         {
4803             io_close((IO*)sv, FALSE);
4804         }
4805         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4806             PerlDir_close(IoDIRP(sv));
4807         IoDIRP(sv) = (DIR*)NULL;
4808         Safefree(IoTOP_NAME(sv));
4809         Safefree(IoFMT_NAME(sv));
4810         Safefree(IoBOTTOM_NAME(sv));
4811         goto freescalar;
4812     case SVt_PVBM:
4813         goto freescalar;
4814     case SVt_PVCV:
4815     case SVt_PVFM:
4816         cv_undef((CV*)sv);
4817         goto freescalar;
4818     case SVt_PVHV:
4819         Perl_hv_kill_backrefs(aTHX_ (HV*)sv);
4820         hv_undef((HV*)sv);
4821         break;
4822     case SVt_PVAV:
4823         av_undef((AV*)sv);
4824         break;
4825     case SVt_PVLV:
4826         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4827             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4828             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4829             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4830         }
4831         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4832             SvREFCNT_dec(LvTARG(sv));
4833         goto freescalar;
4834     case SVt_PVGV:
4835         gp_free((GV*)sv);
4836         Safefree(GvNAME(sv));
4837         /* If we're in a stash, we don't own a reference to it. However it does
4838            have a back reference to us, which needs to be cleared.  */
4839         if (GvSTASH(sv))
4840             sv_del_backref((SV*)GvSTASH(sv), sv);
4841     case SVt_PVMG:
4842     case SVt_PVNV:
4843     case SVt_PVIV:
4844       freescalar:
4845         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4846         if (SvOOK(sv)) {
4847             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4848             /* Don't even bother with turning off the OOK flag.  */
4849         }
4850     case SVt_PV:
4851     case SVt_RV:
4852         if (SvROK(sv)) {
4853             SV *target = SvRV(sv);
4854             if (SvWEAKREF(sv))
4855                 sv_del_backref(target, sv);
4856             else
4857                 SvREFCNT_dec(target);
4858         }
4859 #ifdef PERL_OLD_COPY_ON_WRITE
4860         else if (SvPVX_const(sv)) {
4861             if (SvIsCOW(sv)) {
4862                 /* I believe I need to grab the global SV mutex here and
4863                    then recheck the COW status.  */
4864                 if (DEBUG_C_TEST) {
4865                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4866                     sv_dump(sv);
4867                 }
4868                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4869                                SV_COW_NEXT_SV(sv));
4870                 /* And drop it here.  */
4871                 SvFAKE_off(sv);
4872             } else if (SvLEN(sv)) {
4873                 Safefree(SvPVX_const(sv));
4874             }
4875         }
4876 #else
4877         else if (SvPVX_const(sv) && SvLEN(sv))
4878             Safefree(SvPVX_mutable(sv));
4879         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4880             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4881             SvFAKE_off(sv);
4882         }
4883 #endif
4884         break;
4885     case SVt_NV:
4886         break;
4887     }
4888
4889     SvFLAGS(sv) &= SVf_BREAK;
4890     SvFLAGS(sv) |= SVTYPEMASK;
4891
4892     if (sv_type_details->arena) {
4893         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4894                  &PL_body_roots[type]);
4895     }
4896     else if (sv_type_details->size) {
4897         my_safefree(SvANY(sv));
4898     }
4899 }
4900
4901 /*
4902 =for apidoc sv_newref
4903
4904 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
4905 instead.
4906
4907 =cut
4908 */
4909
4910 SV *
4911 Perl_sv_newref(pTHX_ SV *sv)
4912 {
4913     if (sv)
4914         (SvREFCNT(sv))++;
4915     return sv;
4916 }
4917
4918 /*
4919 =for apidoc sv_free
4920
4921 Decrement an SV's reference count, and if it drops to zero, call
4922 C<sv_clear> to invoke destructors and free up any memory used by
4923 the body; finally, deallocate the SV's head itself.
4924 Normally called via a wrapper macro C<SvREFCNT_dec>.
4925
4926 =cut
4927 */
4928
4929 void
4930 Perl_sv_free(pTHX_ SV *sv)
4931 {
4932     dVAR;
4933     if (!sv)
4934         return;
4935     if (SvREFCNT(sv) == 0) {
4936         if (SvFLAGS(sv) & SVf_BREAK)
4937             /* this SV's refcnt has been artificially decremented to
4938              * trigger cleanup */
4939             return;
4940         if (PL_in_clean_all) /* All is fair */
4941             return;
4942         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4943             /* make sure SvREFCNT(sv)==0 happens very seldom */
4944             SvREFCNT(sv) = (~(U32)0)/2;
4945             return;
4946         }
4947         if (ckWARN_d(WARN_INTERNAL)) {
4948             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
4949                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
4950                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4951 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
4952             Perl_dump_sv_child(aTHX_ sv);
4953 #endif
4954         }
4955         return;
4956     }
4957     if (--(SvREFCNT(sv)) > 0)
4958         return;
4959     Perl_sv_free2(aTHX_ sv);
4960 }
4961
4962 void
4963 Perl_sv_free2(pTHX_ SV *sv)
4964 {
4965     dVAR;
4966 #ifdef DEBUGGING
4967     if (SvTEMP(sv)) {
4968         if (ckWARN_d(WARN_DEBUGGING))
4969             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
4970                         "Attempt to free temp prematurely: SV 0x%"UVxf
4971                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4972         return;
4973     }
4974 #endif
4975     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4976         /* make sure SvREFCNT(sv)==0 happens very seldom */
4977         SvREFCNT(sv) = (~(U32)0)/2;
4978         return;
4979     }
4980     sv_clear(sv);
4981     if (! SvREFCNT(sv))
4982         del_SV(sv);
4983 }
4984
4985 /*
4986 =for apidoc sv_len
4987
4988 Returns the length of the string in the SV. Handles magic and type
4989 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
4990
4991 =cut
4992 */
4993
4994 STRLEN
4995 Perl_sv_len(pTHX_ register SV *sv)
4996 {
4997     STRLEN len;
4998
4999     if (!sv)
5000         return 0;
5001
5002     if (SvGMAGICAL(sv))
5003         len = mg_length(sv);
5004     else
5005         (void)SvPV_const(sv, len);
5006     return len;
5007 }
5008
5009 /*
5010 =for apidoc sv_len_utf8
5011
5012 Returns the number of characters in the string in an SV, counting wide
5013 UTF-8 bytes as a single character. Handles magic and type coercion.
5014
5015 =cut
5016 */
5017
5018 /*
5019  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
5020  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
5021  * (Note that the mg_len is not the length of the mg_ptr field.)
5022  *
5023  */
5024
5025 STRLEN
5026 Perl_sv_len_utf8(pTHX_ register SV *sv)
5027 {
5028     if (!sv)
5029         return 0;
5030
5031     if (SvGMAGICAL(sv))
5032         return mg_length(sv);
5033     else
5034     {
5035         STRLEN len, ulen;
5036         const U8 *s = (U8*)SvPV_const(sv, len);
5037         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
5038
5039         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
5040             ulen = mg->mg_len;
5041 #ifdef PERL_UTF8_CACHE_ASSERT
5042             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
5043 #endif
5044         }
5045         else {
5046             ulen = Perl_utf8_length(aTHX_ s, s + len);
5047             if (!mg && !SvREADONLY(sv)) {
5048                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5049                 mg = mg_find(sv, PERL_MAGIC_utf8);
5050                 assert(mg);
5051             }
5052             if (mg)
5053                 mg->mg_len = ulen;
5054         }
5055         return ulen;
5056     }
5057 }
5058
5059 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
5060  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5061  * between UTF-8 and byte offsets.  There are two (substr offset and substr
5062  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
5063  * and byte offset) cache positions.
5064  *
5065  * The mg_len field is used by sv_len_utf8(), see its comments.
5066  * Note that the mg_len is not the length of the mg_ptr field.
5067  *
5068  */
5069 STATIC bool
5070 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
5071                    I32 offsetp, const U8 *s, const U8 *start)
5072 {
5073     bool found = FALSE;
5074
5075     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5076         if (!*mgp)
5077             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
5078         assert(*mgp);
5079
5080         if ((*mgp)->mg_ptr)
5081             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5082         else {
5083             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5084             (*mgp)->mg_ptr = (char *) *cachep;
5085         }
5086         assert(*cachep);
5087
5088         (*cachep)[i]   = offsetp;
5089         (*cachep)[i+1] = s - start;
5090         found = TRUE;
5091     }
5092
5093     return found;
5094 }
5095
5096 /*
5097  * S_utf8_mg_pos() is used to query and update mg_ptr field of
5098  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5099  * between UTF-8 and byte offsets.  See also the comments of
5100  * S_utf8_mg_pos_init().
5101  *
5102  */
5103 STATIC bool
5104 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
5105 {
5106     bool found = FALSE;
5107
5108     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5109         if (!*mgp)
5110             *mgp = mg_find(sv, PERL_MAGIC_utf8);
5111         if (*mgp && (*mgp)->mg_ptr) {
5112             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5113             ASSERT_UTF8_CACHE(*cachep);
5114             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
5115                  found = TRUE;
5116             else {                      /* We will skip to the right spot. */
5117                  STRLEN forw  = 0;
5118                  STRLEN backw = 0;
5119                  const U8* p = NULL;
5120
5121                  /* The assumption is that going backward is half
5122                   * the speed of going forward (that's where the
5123                   * 2 * backw in the below comes from).  (The real
5124                   * figure of course depends on the UTF-8 data.) */
5125
5126                  if ((*cachep)[i] > (STRLEN)uoff) {
5127                       forw  = uoff;
5128                       backw = (*cachep)[i] - (STRLEN)uoff;
5129
5130                       if (forw < 2 * backw)
5131                            p = start;
5132                       else
5133                            p = start + (*cachep)[i+1];
5134                  }
5135                  /* Try this only for the substr offset (i == 0),
5136                   * not for the substr length (i == 2). */
5137                  else if (i == 0) { /* (*cachep)[i] < uoff */
5138                       const STRLEN ulen = sv_len_utf8(sv);
5139
5140                       if ((STRLEN)uoff < ulen) {
5141                            forw  = (STRLEN)uoff - (*cachep)[i];
5142                            backw = ulen - (STRLEN)uoff;
5143
5144                            if (forw < 2 * backw)
5145                                 p = start + (*cachep)[i+1];
5146                            else
5147                                 p = send;
5148                       }
5149
5150                       /* If the string is not long enough for uoff,
5151                        * we could extend it, but not at this low a level. */
5152                  }
5153
5154                  if (p) {
5155                       if (forw < 2 * backw) {
5156                            while (forw--)
5157                                 p += UTF8SKIP(p);
5158                       }
5159                       else {
5160                            while (backw--) {
5161                                 p--;
5162                                 while (UTF8_IS_CONTINUATION(*p))
5163                                      p--;
5164                            }
5165                       }
5166
5167                       /* Update the cache. */
5168                       (*cachep)[i]   = (STRLEN)uoff;
5169                       (*cachep)[i+1] = p - start;
5170
5171                       /* Drop the stale "length" cache */
5172                       if (i == 0) {
5173                           (*cachep)[2] = 0;
5174                           (*cachep)[3] = 0;
5175                       }
5176
5177                       found = TRUE;
5178                  }
5179             }
5180             if (found) {        /* Setup the return values. */
5181                  *offsetp = (*cachep)[i+1];
5182                  *sp = start + *offsetp;
5183                  if (*sp >= send) {
5184                       *sp = send;
5185                       *offsetp = send - start;
5186                  }
5187                  else if (*sp < start) {
5188                       *sp = start;
5189                       *offsetp = 0;
5190                  }
5191             }
5192         }
5193 #ifdef PERL_UTF8_CACHE_ASSERT
5194         if (found) {
5195              U8 *s = start;
5196              I32 n = uoff;
5197
5198              while (n-- && s < send)
5199                   s += UTF8SKIP(s);
5200
5201              if (i == 0) {
5202                   assert(*offsetp == s - start);
5203                   assert((*cachep)[0] == (STRLEN)uoff);
5204                   assert((*cachep)[1] == *offsetp);
5205              }
5206              ASSERT_UTF8_CACHE(*cachep);
5207         }
5208 #endif
5209     }
5210
5211     return found;
5212 }
5213
5214 /*
5215 =for apidoc sv_pos_u2b
5216
5217 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5218 the start of the string, to a count of the equivalent number of bytes; if
5219 lenp is non-zero, it does the same to lenp, but this time starting from
5220 the offset, rather than from the start of the string. Handles magic and
5221 type coercion.
5222
5223 =cut
5224 */
5225
5226 /*
5227  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5228  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5229  * byte offsets.  See also the comments of S_utf8_mg_pos().
5230  *
5231  */
5232
5233 void
5234 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5235 {
5236     const U8 *start;
5237     STRLEN len;
5238
5239     if (!sv)
5240         return;
5241
5242     start = (U8*)SvPV_const(sv, len);
5243     if (len) {
5244         STRLEN boffset = 0;
5245         STRLEN *cache = NULL;
5246         const U8 *s = start;
5247         I32 uoffset = *offsetp;
5248         const U8 * const send = s + len;
5249         MAGIC *mg = NULL;
5250         bool found = utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send);
5251
5252          if (!found && uoffset > 0) {
5253               while (s < send && uoffset--)
5254                    s += UTF8SKIP(s);
5255               if (s >= send)
5256                    s = send;
5257               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5258                   boffset = cache[1];
5259               *offsetp = s - start;
5260          }
5261          if (lenp) {
5262               found = FALSE;
5263               start = s;
5264               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5265                   *lenp -= boffset;
5266                   found = TRUE;
5267               }
5268               if (!found && *lenp > 0) {
5269                    I32 ulen = *lenp;
5270                    if (ulen > 0)
5271                         while (s < send && ulen--)
5272                              s += UTF8SKIP(s);
5273                    if (s >= send)
5274                         s = send;
5275                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5276               }
5277               *lenp = s - start;
5278          }
5279          ASSERT_UTF8_CACHE(cache);
5280     }
5281     else {
5282          *offsetp = 0;
5283          if (lenp)
5284               *lenp = 0;
5285     }
5286
5287     return;
5288 }
5289
5290 /*
5291 =for apidoc sv_pos_b2u
5292
5293 Converts the value pointed to by offsetp from a count of bytes from the
5294 start of the string, to a count of the equivalent number of UTF-8 chars.
5295 Handles magic and type coercion.
5296
5297 =cut
5298 */
5299
5300 /*
5301  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5302  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5303  * byte offsets.  See also the comments of S_utf8_mg_pos().
5304  *
5305  */
5306
5307 void
5308 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5309 {
5310     const U8* s;
5311     STRLEN len;
5312
5313     if (!sv)
5314         return;
5315
5316     s = (const U8*)SvPV_const(sv, len);
5317     if ((I32)len < *offsetp)
5318         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5319     else {
5320         const U8* send = s + *offsetp;
5321         MAGIC* mg = NULL;
5322         STRLEN *cache = NULL;
5323
5324         len = 0;
5325
5326         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5327             mg = mg_find(sv, PERL_MAGIC_utf8);
5328             if (mg && mg->mg_ptr) {
5329                 cache = (STRLEN *) mg->mg_ptr;
5330                 if (cache[1] == (STRLEN)*offsetp) {
5331                     /* An exact match. */
5332                     *offsetp = cache[0];
5333
5334                     return;
5335                 }
5336                 else if (cache[1] < (STRLEN)*offsetp) {
5337                     /* We already know part of the way. */
5338                     len = cache[0];
5339                     s  += cache[1];
5340                     /* Let the below loop do the rest. */
5341                 }
5342                 else { /* cache[1] > *offsetp */
5343                     /* We already know all of the way, now we may
5344                      * be able to walk back.  The same assumption
5345                      * is made as in S_utf8_mg_pos(), namely that
5346                      * walking backward is twice slower than
5347                      * walking forward. */
5348                     const STRLEN forw  = *offsetp;
5349                     STRLEN backw = cache[1] - *offsetp;
5350
5351                     if (!(forw < 2 * backw)) {
5352                         const U8 *p = s + cache[1];
5353                         STRLEN ubackw = 0;
5354                         
5355                         cache[1] -= backw;
5356
5357                         while (backw--) {
5358                             p--;
5359                             while (UTF8_IS_CONTINUATION(*p)) {
5360                                 p--;
5361                                 backw--;
5362                             }
5363                             ubackw++;
5364                         }
5365
5366                         cache[0] -= ubackw;
5367                         *offsetp = cache[0];
5368
5369                         /* Drop the stale "length" cache */
5370                         cache[2] = 0;
5371                         cache[3] = 0;
5372
5373                         return;
5374                     }
5375                 }
5376             }
5377             ASSERT_UTF8_CACHE(cache);
5378         }
5379
5380         while (s < send) {
5381             STRLEN n = 1;
5382
5383             /* Call utf8n_to_uvchr() to validate the sequence
5384              * (unless a simple non-UTF character) */
5385             if (!UTF8_IS_INVARIANT(*s))
5386                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5387             if (n > 0) {
5388                 s += n;
5389                 len++;
5390             }
5391             else
5392                 break;
5393         }
5394
5395         if (!SvREADONLY(sv)) {
5396             if (!mg) {
5397                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5398                 mg = mg_find(sv, PERL_MAGIC_utf8);
5399             }
5400             assert(mg);
5401
5402             if (!mg->mg_ptr) {
5403                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5404                 mg->mg_ptr = (char *) cache;
5405             }
5406             assert(cache);
5407
5408             cache[0] = len;
5409             cache[1] = *offsetp;
5410             /* Drop the stale "length" cache */
5411             cache[2] = 0;
5412             cache[3] = 0;
5413         }
5414
5415         *offsetp = len;
5416     }
5417     return;
5418 }
5419
5420 /*
5421 =for apidoc sv_eq
5422
5423 Returns a boolean indicating whether the strings in the two SVs are
5424 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5425 coerce its args to strings if necessary.
5426
5427 =cut
5428 */
5429
5430 I32
5431 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5432 {
5433     dVAR;
5434     const char *pv1;
5435     STRLEN cur1;
5436     const char *pv2;
5437     STRLEN cur2;
5438     I32  eq     = 0;
5439     char *tpv   = Nullch;
5440     SV* svrecode = Nullsv;
5441
5442     if (!sv1) {
5443         pv1 = "";
5444         cur1 = 0;
5445     }
5446     else
5447         pv1 = SvPV_const(sv1, cur1);
5448
5449     if (!sv2){
5450         pv2 = "";
5451         cur2 = 0;
5452     }
5453     else
5454         pv2 = SvPV_const(sv2, cur2);
5455
5456     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5457         /* Differing utf8ness.
5458          * Do not UTF8size the comparands as a side-effect. */
5459          if (PL_encoding) {
5460               if (SvUTF8(sv1)) {
5461                    svrecode = newSVpvn(pv2, cur2);
5462                    sv_recode_to_utf8(svrecode, PL_encoding);
5463                    pv2 = SvPV_const(svrecode, cur2);
5464               }
5465               else {
5466                    svrecode = newSVpvn(pv1, cur1);
5467                    sv_recode_to_utf8(svrecode, PL_encoding);
5468                    pv1 = SvPV_const(svrecode, cur1);
5469               }
5470               /* Now both are in UTF-8. */
5471               if (cur1 != cur2) {
5472                    SvREFCNT_dec(svrecode);
5473                    return FALSE;
5474               }
5475          }
5476          else {
5477               bool is_utf8 = TRUE;
5478
5479               if (SvUTF8(sv1)) {
5480                    /* sv1 is the UTF-8 one,
5481                     * if is equal it must be downgrade-able */
5482                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5483                                                      &cur1, &is_utf8);
5484                    if (pv != pv1)
5485                         pv1 = tpv = pv;
5486               }
5487               else {
5488                    /* sv2 is the UTF-8 one,
5489                     * if is equal it must be downgrade-able */
5490                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5491                                                       &cur2, &is_utf8);
5492                    if (pv != pv2)
5493                         pv2 = tpv = pv;
5494               }
5495               if (is_utf8) {
5496                    /* Downgrade not possible - cannot be eq */
5497                    assert (tpv == 0);
5498                    return FALSE;
5499               }
5500          }
5501     }
5502
5503     if (cur1 == cur2)
5504         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5505         
5506     if (svrecode)
5507          SvREFCNT_dec(svrecode);
5508
5509     if (tpv)
5510         Safefree(tpv);
5511
5512     return eq;
5513 }
5514
5515 /*
5516 =for apidoc sv_cmp
5517
5518 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5519 string in C<sv1> is less than, equal to, or greater than the string in
5520 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5521 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5522
5523 =cut
5524 */
5525
5526 I32
5527 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5528 {
5529     dVAR;
5530     STRLEN cur1, cur2;
5531     const char *pv1, *pv2;
5532     char *tpv = Nullch;
5533     I32  cmp;
5534     SV *svrecode = Nullsv;
5535
5536     if (!sv1) {
5537         pv1 = "";
5538         cur1 = 0;
5539     }
5540     else
5541         pv1 = SvPV_const(sv1, cur1);
5542
5543     if (!sv2) {
5544         pv2 = "";
5545         cur2 = 0;
5546     }
5547     else
5548         pv2 = SvPV_const(sv2, cur2);
5549
5550     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5551         /* Differing utf8ness.
5552          * Do not UTF8size the comparands as a side-effect. */
5553         if (SvUTF8(sv1)) {
5554             if (PL_encoding) {
5555                  svrecode = newSVpvn(pv2, cur2);
5556                  sv_recode_to_utf8(svrecode, PL_encoding);
5557                  pv2 = SvPV_const(svrecode, cur2);
5558             }
5559             else {
5560                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5561             }
5562         }
5563         else {
5564             if (PL_encoding) {
5565                  svrecode = newSVpvn(pv1, cur1);
5566                  sv_recode_to_utf8(svrecode, PL_encoding);
5567                  pv1 = SvPV_const(svrecode, cur1);
5568             }
5569             else {
5570                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5571             }
5572         }
5573     }
5574
5575     if (!cur1) {
5576         cmp = cur2 ? -1 : 0;
5577     } else if (!cur2) {
5578         cmp = 1;
5579     } else {
5580         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5581
5582         if (retval) {
5583             cmp = retval < 0 ? -1 : 1;
5584         } else if (cur1 == cur2) {
5585             cmp = 0;
5586         } else {
5587             cmp = cur1 < cur2 ? -1 : 1;
5588         }
5589     }
5590
5591     if (svrecode)
5592          SvREFCNT_dec(svrecode);
5593
5594     if (tpv)
5595         Safefree(tpv);
5596
5597     return cmp;
5598 }
5599
5600 /*
5601 =for apidoc sv_cmp_locale
5602
5603 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5604 'use bytes' aware, handles get magic, and will coerce its args to strings
5605 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5606
5607 =cut
5608 */
5609
5610 I32
5611 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5612 {
5613     dVAR;
5614 #ifdef USE_LOCALE_COLLATE
5615
5616     char *pv1, *pv2;
5617     STRLEN len1, len2;
5618     I32 retval;
5619
5620     if (PL_collation_standard)
5621         goto raw_compare;
5622
5623     len1 = 0;
5624     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5625     len2 = 0;
5626     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5627
5628     if (!pv1 || !len1) {
5629         if (pv2 && len2)
5630             return -1;
5631         else
5632             goto raw_compare;
5633     }
5634     else {
5635         if (!pv2 || !len2)
5636             return 1;
5637     }
5638
5639     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5640
5641     if (retval)
5642         return retval < 0 ? -1 : 1;
5643
5644     /*
5645      * When the result of collation is equality, that doesn't mean
5646      * that there are no differences -- some locales exclude some
5647      * characters from consideration.  So to avoid false equalities,
5648      * we use the raw string as a tiebreaker.
5649      */
5650
5651   raw_compare:
5652     /* FALL THROUGH */
5653
5654 #endif /* USE_LOCALE_COLLATE */
5655
5656     return sv_cmp(sv1, sv2);
5657 }
5658
5659
5660 #ifdef USE_LOCALE_COLLATE
5661
5662 /*
5663 =for apidoc sv_collxfrm
5664
5665 Add Collate Transform magic to an SV if it doesn't already have it.
5666
5667 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5668 scalar data of the variable, but transformed to such a format that a normal
5669 memory comparison can be used to compare the data according to the locale
5670 settings.
5671
5672 =cut
5673 */
5674
5675 char *
5676 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5677 {
5678     dVAR;
5679     MAGIC *mg;
5680
5681     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5682     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5683         const char *s;
5684         char *xf;
5685         STRLEN len, xlen;
5686
5687         if (mg)
5688             Safefree(mg->mg_ptr);
5689         s = SvPV_const(sv, len);
5690         if ((xf = mem_collxfrm(s, len, &xlen))) {
5691             if (SvREADONLY(sv)) {
5692                 SAVEFREEPV(xf);
5693                 *nxp = xlen;
5694                 return xf + sizeof(PL_collation_ix);
5695             }
5696             if (! mg) {
5697                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5698                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5699                 assert(mg);
5700             }
5701             mg->mg_ptr = xf;
5702             mg->mg_len = xlen;
5703         }
5704         else {
5705             if (mg) {
5706                 mg->mg_ptr = NULL;
5707                 mg->mg_len = -1;
5708             }
5709         }
5710     }
5711     if (mg && mg->mg_ptr) {
5712         *nxp = mg->mg_len;
5713         return mg->mg_ptr + sizeof(PL_collation_ix);
5714     }
5715     else {
5716         *nxp = 0;
5717         return NULL;
5718     }
5719 }
5720
5721 #endif /* USE_LOCALE_COLLATE */
5722
5723 /*
5724 =for apidoc sv_gets
5725
5726 Get a line from the filehandle and store it into the SV, optionally
5727 appending to the currently-stored string.
5728
5729 =cut
5730 */
5731
5732 char *
5733 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5734 {
5735     dVAR;
5736     const char *rsptr;
5737     STRLEN rslen;
5738     register STDCHAR rslast;
5739     register STDCHAR *bp;
5740     register I32 cnt;
5741     I32 i = 0;
5742     I32 rspara = 0;
5743     I32 recsize;
5744
5745     if (SvTHINKFIRST(sv))
5746         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5747     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5748        from <>.
5749        However, perlbench says it's slower, because the existing swipe code
5750        is faster than copy on write.
5751        Swings and roundabouts.  */
5752     SvUPGRADE(sv, SVt_PV);
5753
5754     SvSCREAM_off(sv);
5755
5756     if (append) {
5757         if (PerlIO_isutf8(fp)) {
5758             if (!SvUTF8(sv)) {
5759                 sv_utf8_upgrade_nomg(sv);
5760                 sv_pos_u2b(sv,&append,0);
5761             }
5762         } else if (SvUTF8(sv)) {
5763             SV * const tsv = NEWSV(0,0);
5764             sv_gets(tsv, fp, 0);
5765             sv_utf8_upgrade_nomg(tsv);
5766             SvCUR_set(sv,append);
5767             sv_catsv(sv,tsv);
5768             sv_free(tsv);
5769             goto return_string_or_null;
5770         }
5771     }
5772
5773     SvPOK_only(sv);
5774     if (PerlIO_isutf8(fp))
5775         SvUTF8_on(sv);
5776
5777     if (IN_PERL_COMPILETIME) {
5778         /* we always read code in line mode */
5779         rsptr = "\n";
5780         rslen = 1;
5781     }
5782     else if (RsSNARF(PL_rs)) {
5783         /* If it is a regular disk file use size from stat() as estimate
5784            of amount we are going to read - may result in malloc-ing
5785            more memory than we realy need if layers bellow reduce
5786            size we read (e.g. CRLF or a gzip layer)
5787          */
5788         Stat_t st;
5789         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5790             const Off_t offset = PerlIO_tell(fp);
5791             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5792                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5793             }
5794         }
5795         rsptr = NULL;
5796         rslen = 0;
5797     }
5798     else if (RsRECORD(PL_rs)) {
5799       I32 bytesread;
5800       char *buffer;
5801
5802       /* Grab the size of the record we're getting */
5803       recsize = SvIV(SvRV(PL_rs));
5804       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5805       /* Go yank in */
5806 #ifdef VMS
5807       /* VMS wants read instead of fread, because fread doesn't respect */
5808       /* RMS record boundaries. This is not necessarily a good thing to be */
5809       /* doing, but we've got no other real choice - except avoid stdio
5810          as implementation - perhaps write a :vms layer ?
5811        */
5812       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5813 #else
5814       bytesread = PerlIO_read(fp, buffer, recsize);
5815 #endif
5816       if (bytesread < 0)
5817           bytesread = 0;
5818       SvCUR_set(sv, bytesread += append);
5819       buffer[bytesread] = '\0';
5820       goto return_string_or_null;
5821     }
5822     else if (RsPARA(PL_rs)) {
5823         rsptr = "\n\n";
5824         rslen = 2;
5825         rspara = 1;
5826     }
5827     else {
5828         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5829         if (PerlIO_isutf8(fp)) {
5830             rsptr = SvPVutf8(PL_rs, rslen);
5831         }
5832         else {
5833             if (SvUTF8(PL_rs)) {
5834                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5835                     Perl_croak(aTHX_ "Wide character in $/");
5836                 }
5837             }
5838             rsptr = SvPV_const(PL_rs, rslen);
5839         }
5840     }
5841
5842     rslast = rslen ? rsptr[rslen - 1] : '\0';
5843
5844     if (rspara) {               /* have to do this both before and after */
5845         do {                    /* to make sure file boundaries work right */
5846             if (PerlIO_eof(fp))
5847                 return 0;
5848             i = PerlIO_getc(fp);
5849             if (i != '\n') {
5850                 if (i == -1)
5851                     return 0;
5852                 PerlIO_ungetc(fp,i);
5853                 break;
5854             }
5855         } while (i != EOF);
5856     }
5857
5858     /* See if we know enough about I/O mechanism to cheat it ! */
5859
5860     /* This used to be #ifdef test - it is made run-time test for ease
5861        of abstracting out stdio interface. One call should be cheap
5862        enough here - and may even be a macro allowing compile
5863        time optimization.
5864      */
5865
5866     if (PerlIO_fast_gets(fp)) {
5867
5868     /*
5869      * We're going to steal some values from the stdio struct
5870      * and put EVERYTHING in the innermost loop into registers.
5871      */
5872     register STDCHAR *ptr;
5873     STRLEN bpx;
5874     I32 shortbuffered;
5875
5876 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5877     /* An ungetc()d char is handled separately from the regular
5878      * buffer, so we getc() it back out and stuff it in the buffer.
5879      */
5880     i = PerlIO_getc(fp);
5881     if (i == EOF) return 0;
5882     *(--((*fp)->_ptr)) = (unsigned char) i;
5883     (*fp)->_cnt++;
5884 #endif
5885
5886     /* Here is some breathtakingly efficient cheating */
5887
5888     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5889     /* make sure we have the room */
5890     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5891         /* Not room for all of it
5892            if we are looking for a separator and room for some
5893          */
5894         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5895             /* just process what we have room for */
5896             shortbuffered = cnt - SvLEN(sv) + append + 1;
5897             cnt -= shortbuffered;
5898         }
5899         else {
5900             shortbuffered = 0;
5901             /* remember that cnt can be negative */
5902             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5903         }
5904     }
5905     else
5906         shortbuffered = 0;
5907     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
5908     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
5909     DEBUG_P(PerlIO_printf(Perl_debug_log,
5910         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5911     DEBUG_P(PerlIO_printf(Perl_debug_log,
5912         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5913                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5914                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
5915     for (;;) {
5916       screamer:
5917         if (cnt > 0) {
5918             if (rslen) {
5919                 while (cnt > 0) {                    /* this     |  eat */
5920                     cnt--;
5921                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
5922                         goto thats_all_folks;        /* screams  |  sed :-) */
5923                 }
5924             }
5925             else {
5926                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
5927                 bp += cnt;                           /* screams  |  dust */
5928                 ptr += cnt;                          /* louder   |  sed :-) */
5929                 cnt = 0;
5930             }
5931         }
5932         
5933         if (shortbuffered) {            /* oh well, must extend */
5934             cnt = shortbuffered;
5935             shortbuffered = 0;
5936             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
5937             SvCUR_set(sv, bpx);
5938             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
5939             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
5940             continue;
5941         }
5942
5943         DEBUG_P(PerlIO_printf(Perl_debug_log,
5944                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
5945                               PTR2UV(ptr),(long)cnt));
5946         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
5947 #if 0
5948         DEBUG_P(PerlIO_printf(Perl_debug_log,
5949             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5950             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5951             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5952 #endif
5953         /* This used to call 'filbuf' in stdio form, but as that behaves like
5954            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
5955            another abstraction.  */
5956         i   = PerlIO_getc(fp);          /* get more characters */
5957 #if 0
5958         DEBUG_P(PerlIO_printf(Perl_debug_log,
5959             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5960             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5961             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5962 #endif
5963         cnt = PerlIO_get_cnt(fp);
5964         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
5965         DEBUG_P(PerlIO_printf(Perl_debug_log,
5966             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5967
5968         if (i == EOF)                   /* all done for ever? */
5969             goto thats_really_all_folks;
5970
5971         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
5972         SvCUR_set(sv, bpx);
5973         SvGROW(sv, bpx + cnt + 2);
5974         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
5975
5976         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
5977
5978         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
5979             goto thats_all_folks;
5980     }
5981
5982 thats_all_folks:
5983     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
5984           memNE((char*)bp - rslen, rsptr, rslen))
5985         goto screamer;                          /* go back to the fray */
5986 thats_really_all_folks:
5987     if (shortbuffered)
5988         cnt += shortbuffered;
5989         DEBUG_P(PerlIO_printf(Perl_debug_log,
5990             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5991     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
5992     DEBUG_P(PerlIO_printf(Perl_debug_log,
5993         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5994         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5995         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5996     *bp = '\0';
5997     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
5998     DEBUG_P(PerlIO_printf(Perl_debug_log,
5999         "Screamer: done, len=%ld, string=|%.*s|\n",
6000         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
6001     }
6002    else
6003     {
6004        /*The big, slow, and stupid way. */
6005 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
6006         STDCHAR *buf = NULL;
6007         Newx(buf, 8192, STDCHAR);
6008         assert(buf);
6009 #else
6010         STDCHAR buf[8192];
6011 #endif
6012
6013 screamer2:
6014         if (rslen) {
6015             register const STDCHAR * const bpe = buf + sizeof(buf);
6016             bp = buf;
6017             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
6018                 ; /* keep reading */
6019             cnt = bp - buf;
6020         }
6021         else {
6022             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
6023             /* Accomodate broken VAXC compiler, which applies U8 cast to
6024              * both args of ?: operator, causing EOF to change into 255
6025              */
6026             if (cnt > 0)
6027                  i = (U8)buf[cnt - 1];
6028             else
6029                  i = EOF;
6030         }
6031
6032         if (cnt < 0)
6033             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
6034         if (append)
6035              sv_catpvn(sv, (char *) buf, cnt);
6036         else
6037              sv_setpvn(sv, (char *) buf, cnt);
6038
6039         if (i != EOF &&                 /* joy */
6040             (!rslen ||
6041              SvCUR(sv) < rslen ||
6042              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
6043         {
6044             append = -1;
6045             /*
6046              * If we're reading from a TTY and we get a short read,
6047              * indicating that the user hit his EOF character, we need
6048              * to notice it now, because if we try to read from the TTY
6049              * again, the EOF condition will disappear.
6050              *
6051              * The comparison of cnt to sizeof(buf) is an optimization
6052              * that prevents unnecessary calls to feof().
6053              *
6054              * - jik 9/25/96
6055              */
6056             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
6057                 goto screamer2;
6058         }
6059
6060 #ifdef USE_HEAP_INSTEAD_OF_STACK
6061         Safefree(buf);
6062 #endif
6063     }
6064
6065     if (rspara) {               /* have to do this both before and after */
6066         while (i != EOF) {      /* to make sure file boundaries work right */
6067             i = PerlIO_getc(fp);
6068             if (i != '\n') {
6069                 PerlIO_ungetc(fp,i);
6070                 break;
6071             }
6072         }
6073     }
6074
6075 return_string_or_null:
6076     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
6077 }
6078
6079 /*
6080 =for apidoc sv_inc
6081
6082 Auto-increment of the value in the SV, doing string to numeric conversion
6083 if necessary. Handles 'get' magic.
6084
6085 =cut
6086 */
6087
6088 void
6089 Perl_sv_inc(pTHX_ register SV *sv)
6090 {
6091     dVAR;
6092     register char *d;
6093     int flags;
6094
6095     if (!sv)
6096         return;
6097     SvGETMAGIC(sv);
6098     if (SvTHINKFIRST(sv)) {
6099         if (SvIsCOW(sv))
6100             sv_force_normal_flags(sv, 0);
6101         if (SvREADONLY(sv)) {
6102             if (IN_PERL_RUNTIME)
6103                 Perl_croak(aTHX_ PL_no_modify);
6104         }
6105         if (SvROK(sv)) {
6106             IV i;
6107             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
6108                 return;
6109             i = PTR2IV(SvRV(sv));
6110             sv_unref(sv);
6111             sv_setiv(sv, i);
6112         }
6113     }
6114     flags = SvFLAGS(sv);
6115     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
6116         /* It's (privately or publicly) a float, but not tested as an
6117            integer, so test it to see. */
6118         (void) SvIV(sv);
6119         flags = SvFLAGS(sv);
6120     }
6121     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6122         /* It's publicly an integer, or privately an integer-not-float */
6123 #ifdef PERL_PRESERVE_IVUV
6124       oops_its_int:
6125 #endif
6126         if (SvIsUV(sv)) {
6127             if (SvUVX(sv) == UV_MAX)
6128                 sv_setnv(sv, UV_MAX_P1);
6129             else
6130                 (void)SvIOK_only_UV(sv);
6131                 SvUV_set(sv, SvUVX(sv) + 1);
6132         } else {
6133             if (SvIVX(sv) == IV_MAX)
6134                 sv_setuv(sv, (UV)IV_MAX + 1);
6135             else {
6136                 (void)SvIOK_only(sv);
6137                 SvIV_set(sv, SvIVX(sv) + 1);
6138             }   
6139         }
6140         return;
6141     }
6142     if (flags & SVp_NOK) {
6143         (void)SvNOK_only(sv);
6144         SvNV_set(sv, SvNVX(sv) + 1.0);
6145         return;
6146     }
6147
6148     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6149         if ((flags & SVTYPEMASK) < SVt_PVIV)
6150             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6151         (void)SvIOK_only(sv);
6152         SvIV_set(sv, 1);
6153         return;
6154     }
6155     d = SvPVX(sv);
6156     while (isALPHA(*d)) d++;
6157     while (isDIGIT(*d)) d++;
6158     if (*d) {
6159 #ifdef PERL_PRESERVE_IVUV
6160         /* Got to punt this as an integer if needs be, but we don't issue
6161            warnings. Probably ought to make the sv_iv_please() that does
6162            the conversion if possible, and silently.  */
6163         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6164         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6165             /* Need to try really hard to see if it's an integer.
6166                9.22337203685478e+18 is an integer.
6167                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6168                so $a="9.22337203685478e+18"; $a+0; $a++
6169                needs to be the same as $a="9.22337203685478e+18"; $a++
6170                or we go insane. */
6171         
6172             (void) sv_2iv(sv);
6173             if (SvIOK(sv))
6174                 goto oops_its_int;
6175
6176             /* sv_2iv *should* have made this an NV */
6177             if (flags & SVp_NOK) {
6178                 (void)SvNOK_only(sv);
6179                 SvNV_set(sv, SvNVX(sv) + 1.0);
6180                 return;
6181             }
6182             /* I don't think we can get here. Maybe I should assert this
6183                And if we do get here I suspect that sv_setnv will croak. NWC
6184                Fall through. */
6185 #if defined(USE_LONG_DOUBLE)
6186             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6187                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6188 #else
6189             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6190                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6191 #endif
6192         }
6193 #endif /* PERL_PRESERVE_IVUV */
6194         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6195         return;
6196     }
6197     d--;
6198     while (d >= SvPVX_const(sv)) {
6199         if (isDIGIT(*d)) {
6200             if (++*d <= '9')
6201                 return;
6202             *(d--) = '0';
6203         }
6204         else {
6205 #ifdef EBCDIC
6206             /* MKS: The original code here died if letters weren't consecutive.
6207              * at least it didn't have to worry about non-C locales.  The
6208              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6209              * arranged in order (although not consecutively) and that only
6210              * [A-Za-z] are accepted by isALPHA in the C locale.
6211              */
6212             if (*d != 'z' && *d != 'Z') {
6213                 do { ++*d; } while (!isALPHA(*d));
6214                 return;
6215             }
6216             *(d--) -= 'z' - 'a';
6217 #else
6218             ++*d;
6219             if (isALPHA(*d))
6220                 return;
6221             *(d--) -= 'z' - 'a' + 1;
6222 #endif
6223         }
6224     }
6225     /* oh,oh, the number grew */
6226     SvGROW(sv, SvCUR(sv) + 2);
6227     SvCUR_set(sv, SvCUR(sv) + 1);
6228     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6229         *d = d[-1];
6230     if (isDIGIT(d[1]))
6231         *d = '1';
6232     else
6233         *d = d[1];
6234 }
6235
6236 /*
6237 =for apidoc sv_dec
6238
6239 Auto-decrement of the value in the SV, doing string to numeric conversion
6240 if necessary. Handles 'get' magic.
6241
6242 =cut
6243 */
6244
6245 void
6246 Perl_sv_dec(pTHX_ register SV *sv)
6247 {
6248     dVAR;
6249     int flags;
6250
6251     if (!sv)
6252         return;
6253     SvGETMAGIC(sv);
6254     if (SvTHINKFIRST(sv)) {
6255         if (SvIsCOW(sv))
6256             sv_force_normal_flags(sv, 0);
6257         if (SvREADONLY(sv)) {
6258             if (IN_PERL_RUNTIME)
6259                 Perl_croak(aTHX_ PL_no_modify);
6260         }
6261         if (SvROK(sv)) {
6262             IV i;
6263             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6264                 return;
6265             i = PTR2IV(SvRV(sv));
6266             sv_unref(sv);
6267             sv_setiv(sv, i);
6268         }
6269     }
6270     /* Unlike sv_inc we don't have to worry about string-never-numbers
6271        and keeping them magic. But we mustn't warn on punting */
6272     flags = SvFLAGS(sv);
6273     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6274         /* It's publicly an integer, or privately an integer-not-float */
6275 #ifdef PERL_PRESERVE_IVUV
6276       oops_its_int:
6277 #endif
6278         if (SvIsUV(sv)) {
6279             if (SvUVX(sv) == 0) {
6280                 (void)SvIOK_only(sv);
6281                 SvIV_set(sv, -1);
6282             }
6283             else {
6284                 (void)SvIOK_only_UV(sv);
6285                 SvUV_set(sv, SvUVX(sv) - 1);
6286             }   
6287         } else {
6288             if (SvIVX(sv) == IV_MIN)
6289                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6290             else {
6291                 (void)SvIOK_only(sv);
6292                 SvIV_set(sv, SvIVX(sv) - 1);
6293             }   
6294         }
6295         return;
6296     }
6297     if (flags & SVp_NOK) {
6298         SvNV_set(sv, SvNVX(sv) - 1.0);
6299         (void)SvNOK_only(sv);
6300         return;
6301     }
6302     if (!(flags & SVp_POK)) {
6303         if ((flags & SVTYPEMASK) < SVt_PVIV)
6304             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6305         SvIV_set(sv, -1);
6306         (void)SvIOK_only(sv);
6307         return;
6308     }
6309 #ifdef PERL_PRESERVE_IVUV
6310     {
6311         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6312         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6313             /* Need to try really hard to see if it's an integer.
6314                9.22337203685478e+18 is an integer.
6315                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6316                so $a="9.22337203685478e+18"; $a+0; $a--
6317                needs to be the same as $a="9.22337203685478e+18"; $a--
6318                or we go insane. */
6319         
6320             (void) sv_2iv(sv);
6321             if (SvIOK(sv))
6322                 goto oops_its_int;
6323
6324             /* sv_2iv *should* have made this an NV */
6325             if (flags & SVp_NOK) {
6326                 (void)SvNOK_only(sv);
6327                 SvNV_set(sv, SvNVX(sv) - 1.0);
6328                 return;
6329             }
6330             /* I don't think we can get here. Maybe I should assert this
6331                And if we do get here I suspect that sv_setnv will croak. NWC
6332                Fall through. */
6333 #if defined(USE_LONG_DOUBLE)
6334             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6335                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6336 #else
6337             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6338                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6339 #endif
6340         }
6341     }
6342 #endif /* PERL_PRESERVE_IVUV */
6343     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6344 }
6345
6346 /*
6347 =for apidoc sv_mortalcopy
6348
6349 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6350 The new SV is marked as mortal. It will be destroyed "soon", either by an
6351 explicit call to FREETMPS, or by an implicit call at places such as
6352 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6353
6354 =cut
6355 */
6356
6357 /* Make a string that will exist for the duration of the expression
6358  * evaluation.  Actually, it may have to last longer than that, but
6359  * hopefully we won't free it until it has been assigned to a
6360  * permanent location. */
6361
6362 SV *
6363 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6364 {
6365     dVAR;
6366     register SV *sv;
6367
6368     new_SV(sv);
6369     sv_setsv(sv,oldstr);
6370     EXTEND_MORTAL(1);
6371     PL_tmps_stack[++PL_tmps_ix] = sv;
6372     SvTEMP_on(sv);
6373     return sv;
6374 }
6375
6376 /*
6377 =for apidoc sv_newmortal
6378
6379 Creates a new null SV which is mortal.  The reference count of the SV is
6380 set to 1. It will be destroyed "soon", either by an explicit call to
6381 FREETMPS, or by an implicit call at places such as statement boundaries.
6382 See also C<sv_mortalcopy> and C<sv_2mortal>.
6383
6384 =cut
6385 */
6386
6387 SV *
6388 Perl_sv_newmortal(pTHX)
6389 {
6390     dVAR;
6391     register SV *sv;
6392
6393     new_SV(sv);
6394     SvFLAGS(sv) = SVs_TEMP;
6395     EXTEND_MORTAL(1);
6396     PL_tmps_stack[++PL_tmps_ix] = sv;
6397     return sv;
6398 }
6399
6400 /*
6401 =for apidoc sv_2mortal
6402
6403 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6404 by an explicit call to FREETMPS, or by an implicit call at places such as
6405 statement boundaries.  SvTEMP() is turned on which means that the SV's
6406 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6407 and C<sv_mortalcopy>.
6408
6409 =cut
6410 */
6411
6412 SV *
6413 Perl_sv_2mortal(pTHX_ register SV *sv)
6414 {
6415     dVAR;
6416     if (!sv)
6417         return NULL;
6418     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6419         return sv;
6420     EXTEND_MORTAL(1);
6421     PL_tmps_stack[++PL_tmps_ix] = sv;
6422     SvTEMP_on(sv);
6423     return sv;
6424 }
6425
6426 /*
6427 =for apidoc newSVpv
6428
6429 Creates a new SV and copies a string into it.  The reference count for the
6430 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6431 strlen().  For efficiency, consider using C<newSVpvn> instead.
6432
6433 =cut
6434 */
6435
6436 SV *
6437 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6438 {
6439     dVAR;
6440     register SV *sv;
6441
6442     new_SV(sv);
6443     sv_setpvn(sv,s,len ? len : strlen(s));
6444     return sv;
6445 }
6446
6447 /*
6448 =for apidoc newSVpvn
6449
6450 Creates a new SV and copies a string into it.  The reference count for the
6451 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6452 string.  You are responsible for ensuring that the source string is at least
6453 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6454
6455 =cut
6456 */
6457
6458 SV *
6459 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6460 {
6461     dVAR;
6462     register SV *sv;
6463
6464     new_SV(sv);
6465     sv_setpvn(sv,s,len);
6466     return sv;
6467 }
6468
6469
6470 /*
6471 =for apidoc newSVhek
6472
6473 Creates a new SV from the hash key structure.  It will generate scalars that
6474 point to the shared string table where possible. Returns a new (undefined)
6475 SV if the hek is NULL.
6476
6477 =cut
6478 */
6479
6480 SV *
6481 Perl_newSVhek(pTHX_ const HEK *hek)
6482 {
6483     dVAR;
6484     if (!hek) {
6485         SV *sv;
6486
6487         new_SV(sv);
6488         return sv;
6489     }
6490
6491     if (HEK_LEN(hek) == HEf_SVKEY) {
6492         return newSVsv(*(SV**)HEK_KEY(hek));
6493     } else {
6494         const int flags = HEK_FLAGS(hek);
6495         if (flags & HVhek_WASUTF8) {
6496             /* Trouble :-)
6497                Andreas would like keys he put in as utf8 to come back as utf8
6498             */
6499             STRLEN utf8_len = HEK_LEN(hek);
6500             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6501             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6502
6503             SvUTF8_on (sv);
6504             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6505             return sv;
6506         } else if (flags & HVhek_REHASH) {
6507             /* We don't have a pointer to the hv, so we have to replicate the
6508                flag into every HEK. This hv is using custom a hasing
6509                algorithm. Hence we can't return a shared string scalar, as
6510                that would contain the (wrong) hash value, and might get passed
6511                into an hv routine with a regular hash  */
6512
6513             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6514             if (HEK_UTF8(hek))
6515                 SvUTF8_on (sv);
6516             return sv;
6517         }
6518         /* This will be overwhelminly the most common case.  */
6519         return newSVpvn_share(HEK_KEY(hek),
6520                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6521                               HEK_HASH(hek));
6522     }
6523 }
6524
6525 /*
6526 =for apidoc newSVpvn_share
6527
6528 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6529 table. If the string does not already exist in the table, it is created
6530 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6531 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6532 otherwise the hash is computed.  The idea here is that as the string table
6533 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6534 hash lookup will avoid string compare.
6535
6536 =cut
6537 */
6538
6539 SV *
6540 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6541 {
6542     dVAR;
6543     register SV *sv;
6544     bool is_utf8 = FALSE;
6545     if (len < 0) {
6546         STRLEN tmplen = -len;
6547         is_utf8 = TRUE;
6548         /* See the note in hv.c:hv_fetch() --jhi */
6549         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6550         len = tmplen;
6551     }
6552     if (!hash)
6553         PERL_HASH(hash, src, len);
6554     new_SV(sv);
6555     sv_upgrade(sv, SVt_PV);
6556     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6557     SvCUR_set(sv, len);
6558     SvLEN_set(sv, 0);
6559     SvREADONLY_on(sv);
6560     SvFAKE_on(sv);
6561     SvPOK_on(sv);
6562     if (is_utf8)
6563         SvUTF8_on(sv);
6564     return sv;
6565 }
6566
6567
6568 #if defined(PERL_IMPLICIT_CONTEXT)
6569
6570 /* pTHX_ magic can't cope with varargs, so this is a no-context
6571  * version of the main function, (which may itself be aliased to us).
6572  * Don't access this version directly.
6573  */
6574
6575 SV *
6576 Perl_newSVpvf_nocontext(const char* pat, ...)
6577 {
6578     dTHX;
6579     register SV *sv;
6580     va_list args;
6581     va_start(args, pat);
6582     sv = vnewSVpvf(pat, &args);
6583     va_end(args);
6584     return sv;
6585 }
6586 #endif
6587
6588 /*
6589 =for apidoc newSVpvf
6590
6591 Creates a new SV and initializes it with the string formatted like
6592 C<sprintf>.
6593
6594 =cut
6595 */
6596
6597 SV *
6598 Perl_newSVpvf(pTHX_ const char* pat, ...)
6599 {
6600     register SV *sv;
6601     va_list args;
6602     va_start(args, pat);
6603     sv = vnewSVpvf(pat, &args);
6604     va_end(args);
6605     return sv;
6606 }
6607
6608 /* backend for newSVpvf() and newSVpvf_nocontext() */
6609
6610 SV *
6611 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6612 {
6613     dVAR;
6614     register SV *sv;
6615     new_SV(sv);
6616     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6617     return sv;
6618 }
6619
6620 /*
6621 =for apidoc newSVnv
6622
6623 Creates a new SV and copies a floating point value into it.
6624 The reference count for the SV is set to 1.
6625
6626 =cut
6627 */
6628
6629 SV *
6630 Perl_newSVnv(pTHX_ NV n)
6631 {
6632     dVAR;
6633     register SV *sv;
6634
6635     new_SV(sv);
6636     sv_setnv(sv,n);
6637     return sv;
6638 }
6639
6640 /*
6641 =for apidoc newSViv
6642
6643 Creates a new SV and copies an integer into it.  The reference count for the
6644 SV is set to 1.
6645
6646 =cut
6647 */
6648
6649 SV *
6650 Perl_newSViv(pTHX_ IV i)
6651 {
6652     dVAR;
6653     register SV *sv;
6654
6655     new_SV(sv);
6656     sv_setiv(sv,i);
6657     return sv;
6658 }
6659
6660 /*
6661 =for apidoc newSVuv
6662
6663 Creates a new SV and copies an unsigned integer into it.
6664 The reference count for the SV is set to 1.
6665
6666 =cut
6667 */
6668
6669 SV *
6670 Perl_newSVuv(pTHX_ UV u)
6671 {
6672     dVAR;
6673     register SV *sv;
6674
6675     new_SV(sv);
6676     sv_setuv(sv,u);
6677     return sv;
6678 }
6679
6680 /*
6681 =for apidoc newRV_noinc
6682
6683 Creates an RV wrapper for an SV.  The reference count for the original
6684 SV is B<not> incremented.
6685
6686 =cut
6687 */
6688
6689 SV *
6690 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6691 {
6692     dVAR;
6693     register SV *sv;
6694
6695     new_SV(sv);
6696     sv_upgrade(sv, SVt_RV);
6697     SvTEMP_off(tmpRef);
6698     SvRV_set(sv, tmpRef);
6699     SvROK_on(sv);
6700     return sv;
6701 }
6702
6703 /* newRV_inc is the official function name to use now.
6704  * newRV_inc is in fact #defined to newRV in sv.h
6705  */
6706
6707 SV *
6708 Perl_newRV(pTHX_ SV *tmpRef)
6709 {
6710     dVAR;
6711     return newRV_noinc(SvREFCNT_inc(tmpRef));
6712 }
6713
6714 /*
6715 =for apidoc newSVsv
6716
6717 Creates a new SV which is an exact duplicate of the original SV.
6718 (Uses C<sv_setsv>).
6719
6720 =cut
6721 */
6722
6723 SV *
6724 Perl_newSVsv(pTHX_ register SV *old)
6725 {
6726     dVAR;
6727     register SV *sv;
6728
6729     if (!old)
6730         return NULL;
6731     if (SvTYPE(old) == SVTYPEMASK) {
6732         if (ckWARN_d(WARN_INTERNAL))
6733             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6734         return Nullsv;
6735     }
6736     new_SV(sv);
6737     /* SV_GMAGIC is the default for sv_setv()
6738        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6739        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6740     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6741     return sv;
6742 }
6743
6744 /*
6745 =for apidoc sv_reset
6746
6747 Underlying implementation for the C<reset> Perl function.
6748 Note that the perl-level function is vaguely deprecated.
6749
6750 =cut
6751 */
6752
6753 void
6754 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6755 {
6756     dVAR;
6757     char todo[PERL_UCHAR_MAX+1];
6758
6759     if (!stash)
6760         return;
6761
6762     if (!*s) {          /* reset ?? searches */
6763         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6764         if (mg) {
6765             PMOP *pm = (PMOP *) mg->mg_obj;
6766             while (pm) {
6767                 pm->op_pmdynflags &= ~PMdf_USED;
6768                 pm = pm->op_pmnext;
6769             }
6770         }
6771         return;
6772     }
6773
6774     /* reset variables */
6775
6776     if (!HvARRAY(stash))
6777         return;
6778
6779     Zero(todo, 256, char);
6780     while (*s) {
6781         I32 max;
6782         I32 i = (unsigned char)*s;
6783         if (s[1] == '-') {
6784             s += 2;
6785         }
6786         max = (unsigned char)*s++;
6787         for ( ; i <= max; i++) {
6788             todo[i] = 1;
6789         }
6790         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6791             HE *entry;
6792             for (entry = HvARRAY(stash)[i];
6793                  entry;
6794                  entry = HeNEXT(entry))
6795             {
6796                 register GV *gv;
6797                 register SV *sv;
6798
6799                 if (!todo[(U8)*HeKEY(entry)])
6800                     continue;
6801                 gv = (GV*)HeVAL(entry);
6802                 sv = GvSV(gv);
6803                 if (sv) {
6804                     if (SvTHINKFIRST(sv)) {
6805                         if (!SvREADONLY(sv) && SvROK(sv))
6806                             sv_unref(sv);
6807                         /* XXX Is this continue a bug? Why should THINKFIRST
6808                            exempt us from resetting arrays and hashes?  */
6809                         continue;
6810                     }
6811                     SvOK_off(sv);
6812                     if (SvTYPE(sv) >= SVt_PV) {
6813                         SvCUR_set(sv, 0);
6814                         if (SvPVX_const(sv) != Nullch)
6815                             *SvPVX(sv) = '\0';
6816                         SvTAINT(sv);
6817                     }
6818                 }
6819                 if (GvAV(gv)) {
6820                     av_clear(GvAV(gv));
6821                 }
6822                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6823 #if defined(VMS)
6824                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6825 #else /* ! VMS */
6826                     hv_clear(GvHV(gv));
6827 #  if defined(USE_ENVIRON_ARRAY)
6828                     if (gv == PL_envgv)
6829                         my_clearenv();
6830 #  endif /* USE_ENVIRON_ARRAY */
6831 #endif /* VMS */
6832                 }
6833             }
6834         }
6835     }
6836 }
6837
6838 /*
6839 =for apidoc sv_2io
6840
6841 Using various gambits, try to get an IO from an SV: the IO slot if its a
6842 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6843 named after the PV if we're a string.
6844
6845 =cut
6846 */
6847
6848 IO*
6849 Perl_sv_2io(pTHX_ SV *sv)
6850 {
6851     IO* io;
6852     GV* gv;
6853
6854     switch (SvTYPE(sv)) {
6855     case SVt_PVIO:
6856         io = (IO*)sv;
6857         break;
6858     case SVt_PVGV:
6859         gv = (GV*)sv;
6860         io = GvIO(gv);
6861         if (!io)
6862             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6863         break;
6864     default:
6865         if (!SvOK(sv))
6866             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6867         if (SvROK(sv))
6868             return sv_2io(SvRV(sv));
6869         gv = gv_fetchsv(sv, 0, SVt_PVIO);
6870         if (gv)
6871             io = GvIO(gv);
6872         else
6873             io = 0;
6874         if (!io)
6875             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6876         break;
6877     }
6878     return io;
6879 }
6880
6881 /*
6882 =for apidoc sv_2cv
6883
6884 Using various gambits, try to get a CV from an SV; in addition, try if
6885 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6886 The flags in C<lref> are passed to sv_fetchsv.
6887
6888 =cut
6889 */
6890
6891 CV *
6892 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6893 {
6894     dVAR;
6895     GV *gv = Nullgv;
6896     CV *cv = Nullcv;
6897
6898     if (!sv)
6899         return *st = NULL, *gvp = Nullgv, Nullcv;
6900     switch (SvTYPE(sv)) {
6901     case SVt_PVCV:
6902         *st = CvSTASH(sv);
6903         *gvp = Nullgv;
6904         return (CV*)sv;
6905     case SVt_PVHV:
6906     case SVt_PVAV:
6907         *st = NULL;
6908         *gvp = Nullgv;
6909         return Nullcv;
6910     case SVt_PVGV:
6911         gv = (GV*)sv;
6912         *gvp = gv;
6913         *st = GvESTASH(gv);
6914         goto fix_gv;
6915
6916     default:
6917         SvGETMAGIC(sv);
6918         if (SvROK(sv)) {
6919             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6920             tryAMAGICunDEREF(to_cv);
6921
6922             sv = SvRV(sv);
6923             if (SvTYPE(sv) == SVt_PVCV) {
6924                 cv = (CV*)sv;
6925                 *gvp = Nullgv;
6926                 *st = CvSTASH(cv);
6927                 return cv;
6928             }
6929             else if(isGV(sv))
6930                 gv = (GV*)sv;
6931             else
6932                 Perl_croak(aTHX_ "Not a subroutine reference");
6933         }
6934         else if (isGV(sv))
6935             gv = (GV*)sv;
6936         else
6937             gv = gv_fetchsv(sv, lref, SVt_PVCV);
6938         *gvp = gv;
6939         if (!gv) {
6940             *st = NULL;
6941             return Nullcv;
6942         }
6943         /* Some flags to gv_fetchsv mean don't really create the GV  */
6944         if (SvTYPE(gv) != SVt_PVGV) {
6945             *st = NULL;
6946             return NULL;
6947         }
6948         *st = GvESTASH(gv);
6949     fix_gv:
6950         if (lref && !GvCVu(gv)) {
6951             SV *tmpsv;
6952             ENTER;
6953             tmpsv = NEWSV(704,0);
6954             gv_efullname3(tmpsv, gv, Nullch);
6955             /* XXX this is probably not what they think they're getting.
6956              * It has the same effect as "sub name;", i.e. just a forward
6957              * declaration! */
6958             newSUB(start_subparse(FALSE, 0),
6959                    newSVOP(OP_CONST, 0, tmpsv),
6960                    Nullop,
6961                    Nullop);
6962             LEAVE;
6963             if (!GvCVu(gv))
6964                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
6965                            sv);
6966         }
6967         return GvCVu(gv);
6968     }
6969 }
6970
6971 /*
6972 =for apidoc sv_true
6973
6974 Returns true if the SV has a true value by Perl's rules.
6975 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
6976 instead use an in-line version.
6977
6978 =cut
6979 */
6980
6981 I32
6982 Perl_sv_true(pTHX_ register SV *sv)
6983 {
6984     if (!sv)
6985         return 0;
6986     if (SvPOK(sv)) {
6987         register const XPV* const tXpv = (XPV*)SvANY(sv);
6988         if (tXpv &&
6989                 (tXpv->xpv_cur > 1 ||
6990                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
6991             return 1;
6992         else
6993             return 0;
6994     }
6995     else {
6996         if (SvIOK(sv))
6997             return SvIVX(sv) != 0;
6998         else {
6999             if (SvNOK(sv))
7000                 return SvNVX(sv) != 0.0;
7001             else
7002                 return sv_2bool(sv);
7003         }
7004     }
7005 }
7006
7007 /*
7008 =for apidoc sv_pvn_force
7009
7010 Get a sensible string out of the SV somehow.
7011 A private implementation of the C<SvPV_force> macro for compilers which
7012 can't cope with complex macro expressions. Always use the macro instead.
7013
7014 =for apidoc sv_pvn_force_flags
7015
7016 Get a sensible string out of the SV somehow.
7017 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
7018 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
7019 implemented in terms of this function.
7020 You normally want to use the various wrapper macros instead: see
7021 C<SvPV_force> and C<SvPV_force_nomg>
7022
7023 =cut
7024 */
7025
7026 char *
7027 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
7028 {
7029     dVAR;
7030     if (SvTHINKFIRST(sv) && !SvROK(sv))
7031         sv_force_normal_flags(sv, 0);
7032
7033     if (SvPOK(sv)) {
7034         if (lp)
7035             *lp = SvCUR(sv);
7036     }
7037     else {
7038         char *s;
7039         STRLEN len;
7040  
7041         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
7042             const char * const ref = sv_reftype(sv,0);
7043             if (PL_op)
7044                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
7045                            ref, OP_NAME(PL_op));
7046             else
7047                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
7048         }
7049         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
7050             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
7051                 OP_NAME(PL_op));
7052         s = sv_2pv_flags(sv, &len, flags);
7053         if (lp)
7054             *lp = len;
7055
7056         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
7057             if (SvROK(sv))
7058                 sv_unref(sv);
7059             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
7060             SvGROW(sv, len + 1);
7061             Move(s,SvPVX(sv),len,char);
7062             SvCUR_set(sv, len);
7063             *SvEND(sv) = '\0';
7064         }
7065         if (!SvPOK(sv)) {
7066             SvPOK_on(sv);               /* validate pointer */
7067             SvTAINT(sv);
7068             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
7069                                   PTR2UV(sv),SvPVX_const(sv)));
7070         }
7071     }
7072     return SvPVX_mutable(sv);
7073 }
7074
7075 /*
7076 =for apidoc sv_pvbyten_force
7077
7078 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
7079
7080 =cut
7081 */
7082
7083 char *
7084 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
7085 {
7086     sv_pvn_force(sv,lp);
7087     sv_utf8_downgrade(sv,0);
7088     *lp = SvCUR(sv);
7089     return SvPVX(sv);
7090 }
7091
7092 /*
7093 =for apidoc sv_pvutf8n_force
7094
7095 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
7096
7097 =cut
7098 */
7099
7100 char *
7101 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
7102 {
7103     sv_pvn_force(sv,lp);
7104     sv_utf8_upgrade(sv);
7105     *lp = SvCUR(sv);
7106     return SvPVX(sv);
7107 }
7108
7109 /*
7110 =for apidoc sv_reftype
7111
7112 Returns a string describing what the SV is a reference to.
7113
7114 =cut
7115 */
7116
7117 char *
7118 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
7119 {
7120     /* The fact that I don't need to downcast to char * everywhere, only in ?:
7121        inside return suggests a const propagation bug in g++.  */
7122     if (ob && SvOBJECT(sv)) {
7123         char * const name = HvNAME_get(SvSTASH(sv));
7124         return name ? name : (char *) "__ANON__";
7125     }
7126     else {
7127         switch (SvTYPE(sv)) {
7128         case SVt_NULL:
7129         case SVt_IV:
7130         case SVt_NV:
7131         case SVt_RV:
7132         case SVt_PV:
7133         case SVt_PVIV:
7134         case SVt_PVNV:
7135         case SVt_PVMG:
7136         case SVt_PVBM:
7137                                 if (SvVOK(sv))
7138                                     return "VSTRING";
7139                                 if (SvROK(sv))
7140                                     return "REF";
7141                                 else
7142                                     return "SCALAR";
7143
7144         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
7145                                 /* tied lvalues should appear to be
7146                                  * scalars for backwards compatitbility */
7147                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
7148                                     ? "SCALAR" : "LVALUE");
7149         case SVt_PVAV:          return "ARRAY";
7150         case SVt_PVHV:          return "HASH";
7151         case SVt_PVCV:          return "CODE";
7152         case SVt_PVGV:          return "GLOB";
7153         case SVt_PVFM:          return "FORMAT";
7154         case SVt_PVIO:          return "IO";
7155         default:                return "UNKNOWN";
7156         }
7157     }
7158 }
7159
7160 /*
7161 =for apidoc sv_isobject
7162
7163 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7164 object.  If the SV is not an RV, or if the object is not blessed, then this
7165 will return false.
7166
7167 =cut
7168 */
7169
7170 int
7171 Perl_sv_isobject(pTHX_ SV *sv)
7172 {
7173     if (!sv)
7174         return 0;
7175     SvGETMAGIC(sv);
7176     if (!SvROK(sv))
7177         return 0;
7178     sv = (SV*)SvRV(sv);
7179     if (!SvOBJECT(sv))
7180         return 0;
7181     return 1;
7182 }
7183
7184 /*
7185 =for apidoc sv_isa
7186
7187 Returns a boolean indicating whether the SV is blessed into the specified
7188 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7189 an inheritance relationship.
7190
7191 =cut
7192 */
7193
7194 int
7195 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7196 {
7197     const char *hvname;
7198     if (!sv)
7199         return 0;
7200     SvGETMAGIC(sv);
7201     if (!SvROK(sv))
7202         return 0;
7203     sv = (SV*)SvRV(sv);
7204     if (!SvOBJECT(sv))
7205         return 0;
7206     hvname = HvNAME_get(SvSTASH(sv));
7207     if (!hvname)
7208         return 0;
7209
7210     return strEQ(hvname, name);
7211 }
7212
7213 /*
7214 =for apidoc newSVrv
7215
7216 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7217 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7218 be blessed in the specified package.  The new SV is returned and its
7219 reference count is 1.
7220
7221 =cut
7222 */
7223
7224 SV*
7225 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7226 {
7227     dVAR;
7228     SV *sv;
7229
7230     new_SV(sv);
7231
7232     SV_CHECK_THINKFIRST_COW_DROP(rv);
7233     SvAMAGIC_off(rv);
7234
7235     if (SvTYPE(rv) >= SVt_PVMG) {
7236         const U32 refcnt = SvREFCNT(rv);
7237         SvREFCNT(rv) = 0;
7238         sv_clear(rv);
7239         SvFLAGS(rv) = 0;
7240         SvREFCNT(rv) = refcnt;
7241     }
7242
7243     if (SvTYPE(rv) < SVt_RV)
7244         sv_upgrade(rv, SVt_RV);
7245     else if (SvTYPE(rv) > SVt_RV) {
7246         SvPV_free(rv);
7247         SvCUR_set(rv, 0);
7248         SvLEN_set(rv, 0);
7249     }
7250
7251     SvOK_off(rv);
7252     SvRV_set(rv, sv);
7253     SvROK_on(rv);
7254
7255     if (classname) {
7256         HV* const stash = gv_stashpv(classname, TRUE);
7257         (void)sv_bless(rv, stash);
7258     }
7259     return sv;
7260 }
7261
7262 /*
7263 =for apidoc sv_setref_pv
7264
7265 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7266 argument will be upgraded to an RV.  That RV will be modified to point to
7267 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7268 into the SV.  The C<classname> argument indicates the package for the
7269 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7270 will have a reference count of 1, and the RV will be returned.
7271
7272 Do not use with other Perl types such as HV, AV, SV, CV, because those
7273 objects will become corrupted by the pointer copy process.
7274
7275 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7276
7277 =cut
7278 */
7279
7280 SV*
7281 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7282 {
7283     dVAR;
7284     if (!pv) {
7285         sv_setsv(rv, &PL_sv_undef);
7286         SvSETMAGIC(rv);
7287     }
7288     else
7289         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7290     return rv;
7291 }
7292
7293 /*
7294 =for apidoc sv_setref_iv
7295
7296 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7297 argument will be upgraded to an RV.  That RV will be modified to point to
7298 the new SV.  The C<classname> argument indicates the package for the
7299 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7300 will have a reference count of 1, and the RV will be returned.
7301
7302 =cut
7303 */
7304
7305 SV*
7306 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7307 {
7308     sv_setiv(newSVrv(rv,classname), iv);
7309     return rv;
7310 }
7311
7312 /*
7313 =for apidoc sv_setref_uv
7314
7315 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7316 argument will be upgraded to an RV.  That RV will be modified to point to
7317 the new SV.  The C<classname> argument indicates the package for the
7318 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7319 will have a reference count of 1, and the RV will be returned.
7320
7321 =cut
7322 */
7323
7324 SV*
7325 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7326 {
7327     sv_setuv(newSVrv(rv,classname), uv);
7328     return rv;
7329 }
7330
7331 /*
7332 =for apidoc sv_setref_nv
7333
7334 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7335 argument will be upgraded to an RV.  That RV will be modified to point to
7336 the new SV.  The C<classname> argument indicates the package for the
7337 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7338 will have a reference count of 1, and the RV will be returned.
7339
7340 =cut
7341 */
7342
7343 SV*
7344 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7345 {
7346     sv_setnv(newSVrv(rv,classname), nv);
7347     return rv;
7348 }
7349
7350 /*
7351 =for apidoc sv_setref_pvn
7352
7353 Copies a string into a new SV, optionally blessing the SV.  The length of the
7354 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7355 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7356 argument indicates the package for the blessing.  Set C<classname> to
7357 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7358 of 1, and the RV will be returned.
7359
7360 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7361
7362 =cut
7363 */
7364
7365 SV*
7366 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7367 {
7368     sv_setpvn(newSVrv(rv,classname), pv, n);
7369     return rv;
7370 }
7371
7372 /*
7373 =for apidoc sv_bless
7374
7375 Blesses an SV into a specified package.  The SV must be an RV.  The package
7376 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7377 of the SV is unaffected.
7378
7379 =cut
7380 */
7381
7382 SV*
7383 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7384 {
7385     dVAR;
7386     SV *tmpRef;
7387     if (!SvROK(sv))
7388         Perl_croak(aTHX_ "Can't bless non-reference value");
7389     tmpRef = SvRV(sv);
7390     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7391         if (SvREADONLY(tmpRef))
7392             Perl_croak(aTHX_ PL_no_modify);
7393         if (SvOBJECT(tmpRef)) {
7394             if (SvTYPE(tmpRef) != SVt_PVIO)
7395                 --PL_sv_objcount;
7396             SvREFCNT_dec(SvSTASH(tmpRef));
7397         }
7398     }
7399     SvOBJECT_on(tmpRef);
7400     if (SvTYPE(tmpRef) != SVt_PVIO)
7401         ++PL_sv_objcount;
7402     SvUPGRADE(tmpRef, SVt_PVMG);
7403     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7404
7405     if (Gv_AMG(stash))
7406         SvAMAGIC_on(sv);
7407     else
7408         SvAMAGIC_off(sv);
7409
7410     if(SvSMAGICAL(tmpRef))
7411         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7412             mg_set(tmpRef);
7413
7414
7415
7416     return sv;
7417 }
7418
7419 /* Downgrades a PVGV to a PVMG.
7420  */
7421
7422 STATIC void
7423 S_sv_unglob(pTHX_ SV *sv)
7424 {
7425     dVAR;
7426     void *xpvmg;
7427
7428     assert(SvTYPE(sv) == SVt_PVGV);
7429     SvFAKE_off(sv);
7430     if (GvGP(sv))
7431         gp_free((GV*)sv);
7432     if (GvSTASH(sv)) {
7433         sv_del_backref((SV*)GvSTASH(sv), sv);
7434         GvSTASH(sv) = NULL;
7435     }
7436     sv_unmagic(sv, PERL_MAGIC_glob);
7437     Safefree(GvNAME(sv));
7438     GvMULTI_off(sv);
7439
7440     /* need to keep SvANY(sv) in the right arena */
7441     xpvmg = new_XPVMG();
7442     StructCopy(SvANY(sv), xpvmg, XPVMG);
7443     del_XPVGV(SvANY(sv));
7444     SvANY(sv) = xpvmg;
7445
7446     SvFLAGS(sv) &= ~SVTYPEMASK;
7447     SvFLAGS(sv) |= SVt_PVMG;
7448 }
7449
7450 /*
7451 =for apidoc sv_unref_flags
7452
7453 Unsets the RV status of the SV, and decrements the reference count of
7454 whatever was being referenced by the RV.  This can almost be thought of
7455 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7456 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7457 (otherwise the decrementing is conditional on the reference count being
7458 different from one or the reference being a readonly SV).
7459 See C<SvROK_off>.
7460
7461 =cut
7462 */
7463
7464 void
7465 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7466 {
7467     SV* const target = SvRV(ref);
7468
7469     if (SvWEAKREF(ref)) {
7470         sv_del_backref(target, ref);
7471         SvWEAKREF_off(ref);
7472         SvRV_set(ref, NULL);
7473         return;
7474     }
7475     SvRV_set(ref, NULL);
7476     SvROK_off(ref);
7477     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7478        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7479     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7480         SvREFCNT_dec(target);
7481     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7482         sv_2mortal(target);     /* Schedule for freeing later */
7483 }
7484
7485 /*
7486 =for apidoc sv_untaint
7487
7488 Untaint an SV. Use C<SvTAINTED_off> instead.
7489 =cut
7490 */
7491
7492 void
7493 Perl_sv_untaint(pTHX_ SV *sv)
7494 {
7495     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7496         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7497         if (mg)
7498             mg->mg_len &= ~1;
7499     }
7500 }
7501
7502 /*
7503 =for apidoc sv_tainted
7504
7505 Test an SV for taintedness. Use C<SvTAINTED> instead.
7506 =cut
7507 */
7508
7509 bool
7510 Perl_sv_tainted(pTHX_ SV *sv)
7511 {
7512     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7513         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7514         if (mg && (mg->mg_len & 1) )
7515             return TRUE;
7516     }
7517     return FALSE;
7518 }
7519
7520 /*
7521 =for apidoc sv_setpviv
7522
7523 Copies an integer into the given SV, also updating its string value.
7524 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7525
7526 =cut
7527 */
7528
7529 void
7530 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7531 {
7532     char buf[TYPE_CHARS(UV)];
7533     char *ebuf;
7534     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7535
7536     sv_setpvn(sv, ptr, ebuf - ptr);
7537 }
7538
7539 /*
7540 =for apidoc sv_setpviv_mg
7541
7542 Like C<sv_setpviv>, but also handles 'set' magic.
7543
7544 =cut
7545 */
7546
7547 void
7548 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7549 {
7550     sv_setpviv(sv, iv);
7551     SvSETMAGIC(sv);
7552 }
7553
7554 #if defined(PERL_IMPLICIT_CONTEXT)
7555
7556 /* pTHX_ magic can't cope with varargs, so this is a no-context
7557  * version of the main function, (which may itself be aliased to us).
7558  * Don't access this version directly.
7559  */
7560
7561 void
7562 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7563 {
7564     dTHX;
7565     va_list args;
7566     va_start(args, pat);
7567     sv_vsetpvf(sv, pat, &args);
7568     va_end(args);
7569 }
7570
7571 /* pTHX_ magic can't cope with varargs, so this is a no-context
7572  * version of the main function, (which may itself be aliased to us).
7573  * Don't access this version directly.
7574  */
7575
7576 void
7577 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7578 {
7579     dTHX;
7580     va_list args;
7581     va_start(args, pat);
7582     sv_vsetpvf_mg(sv, pat, &args);
7583     va_end(args);
7584 }
7585 #endif
7586
7587 /*
7588 =for apidoc sv_setpvf
7589
7590 Works like C<sv_catpvf> but copies the text into the SV instead of
7591 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7592
7593 =cut
7594 */
7595
7596 void
7597 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7598 {
7599     va_list args;
7600     va_start(args, pat);
7601     sv_vsetpvf(sv, pat, &args);
7602     va_end(args);
7603 }
7604
7605 /*
7606 =for apidoc sv_vsetpvf
7607
7608 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7609 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7610
7611 Usually used via its frontend C<sv_setpvf>.
7612
7613 =cut
7614 */
7615
7616 void
7617 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7618 {
7619     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7620 }
7621
7622 /*
7623 =for apidoc sv_setpvf_mg
7624
7625 Like C<sv_setpvf>, but also handles 'set' magic.
7626
7627 =cut
7628 */
7629
7630 void
7631 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7632 {
7633     va_list args;
7634     va_start(args, pat);
7635     sv_vsetpvf_mg(sv, pat, &args);
7636     va_end(args);
7637 }
7638
7639 /*
7640 =for apidoc sv_vsetpvf_mg
7641
7642 Like C<sv_vsetpvf>, but also handles 'set' magic.
7643
7644 Usually used via its frontend C<sv_setpvf_mg>.
7645
7646 =cut
7647 */
7648
7649 void
7650 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7651 {
7652     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7653     SvSETMAGIC(sv);
7654 }
7655
7656 #if defined(PERL_IMPLICIT_CONTEXT)
7657
7658 /* pTHX_ magic can't cope with varargs, so this is a no-context
7659  * version of the main function, (which may itself be aliased to us).
7660  * Don't access this version directly.
7661  */
7662
7663 void
7664 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7665 {
7666     dTHX;
7667     va_list args;
7668     va_start(args, pat);
7669     sv_vcatpvf(sv, pat, &args);
7670     va_end(args);
7671 }
7672
7673 /* pTHX_ magic can't cope with varargs, so this is a no-context
7674  * version of the main function, (which may itself be aliased to us).
7675  * Don't access this version directly.
7676  */
7677
7678 void
7679 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7680 {
7681     dTHX;
7682     va_list args;
7683     va_start(args, pat);
7684     sv_vcatpvf_mg(sv, pat, &args);
7685     va_end(args);
7686 }
7687 #endif
7688
7689 /*
7690 =for apidoc sv_catpvf
7691
7692 Processes its arguments like C<sprintf> and appends the formatted
7693 output to an SV.  If the appended data contains "wide" characters
7694 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7695 and characters >255 formatted with %c), the original SV might get
7696 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7697 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7698 valid UTF-8; if the original SV was bytes, the pattern should be too.
7699
7700 =cut */
7701
7702 void
7703 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7704 {
7705     va_list args;
7706     va_start(args, pat);
7707     sv_vcatpvf(sv, pat, &args);
7708     va_end(args);
7709 }
7710
7711 /*
7712 =for apidoc sv_vcatpvf
7713
7714 Processes its arguments like C<vsprintf> and appends the formatted output
7715 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7716
7717 Usually used via its frontend C<sv_catpvf>.
7718
7719 =cut
7720 */
7721
7722 void
7723 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7724 {
7725     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7726 }
7727
7728 /*
7729 =for apidoc sv_catpvf_mg
7730
7731 Like C<sv_catpvf>, but also handles 'set' magic.
7732
7733 =cut
7734 */
7735
7736 void
7737 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7738 {
7739     va_list args;
7740     va_start(args, pat);
7741     sv_vcatpvf_mg(sv, pat, &args);
7742     va_end(args);
7743 }
7744
7745 /*
7746 =for apidoc sv_vcatpvf_mg
7747
7748 Like C<sv_vcatpvf>, but also handles 'set' magic.
7749
7750 Usually used via its frontend C<sv_catpvf_mg>.
7751
7752 =cut
7753 */
7754
7755 void
7756 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7757 {
7758     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7759     SvSETMAGIC(sv);
7760 }
7761
7762 /*
7763 =for apidoc sv_vsetpvfn
7764
7765 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7766 appending it.
7767
7768 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7769
7770 =cut
7771 */
7772
7773 void
7774 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7775 {
7776     sv_setpvn(sv, "", 0);
7777     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7778 }
7779
7780 STATIC I32
7781 S_expect_number(pTHX_ char** pattern)
7782 {
7783     dVAR;
7784     I32 var = 0;
7785     switch (**pattern) {
7786     case '1': case '2': case '3':
7787     case '4': case '5': case '6':
7788     case '7': case '8': case '9':
7789         var = *(*pattern)++ - '0';
7790         while (isDIGIT(**pattern)) {
7791             I32 tmp = var * 10 + (*(*pattern)++ - '0');
7792             if (tmp < var)
7793                 Perl_croak(aTHX_ "Integer overflow in format string for %s", (PL_op ? OP_NAME(PL_op) : "sv_vcatpvfn"));
7794             var = tmp;
7795         }
7796     }
7797     return var;
7798 }
7799
7800 STATIC char *
7801 S_F0convert(NV nv, char *endbuf, STRLEN *len)
7802 {
7803     const int neg = nv < 0;
7804     UV uv;
7805
7806     if (neg)
7807         nv = -nv;
7808     if (nv < UV_MAX) {
7809         char *p = endbuf;
7810         nv += 0.5;
7811         uv = (UV)nv;
7812         if (uv & 1 && uv == nv)
7813             uv--;                       /* Round to even */
7814         do {
7815             const unsigned dig = uv % 10;
7816             *--p = '0' + dig;
7817         } while (uv /= 10);
7818         if (neg)
7819             *--p = '-';
7820         *len = endbuf - p;
7821         return p;
7822     }
7823     return Nullch;
7824 }
7825
7826
7827 /*
7828 =for apidoc sv_vcatpvfn
7829
7830 Processes its arguments like C<vsprintf> and appends the formatted output
7831 to an SV.  Uses an array of SVs if the C style variable argument list is
7832 missing (NULL).  When running with taint checks enabled, indicates via
7833 C<maybe_tainted> if results are untrustworthy (often due to the use of
7834 locales).
7835
7836 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7837
7838 =cut
7839 */
7840
7841
7842 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7843                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7844                         vec_utf8 = DO_UTF8(vecsv);
7845
7846 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7847
7848 void
7849 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7850 {
7851     dVAR;
7852     char *p;
7853     char *q;
7854     const char *patend;
7855     STRLEN origlen;
7856     I32 svix = 0;
7857     static const char nullstr[] = "(null)";
7858     SV *argsv = Nullsv;
7859     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7860     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7861     SV *nsv = Nullsv;
7862     /* Times 4: a decimal digit takes more than 3 binary digits.
7863      * NV_DIG: mantissa takes than many decimal digits.
7864      * Plus 32: Playing safe. */
7865     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7866     /* large enough for "%#.#f" --chip */
7867     /* what about long double NVs? --jhi */
7868
7869     PERL_UNUSED_ARG(maybe_tainted);
7870
7871     /* no matter what, this is a string now */
7872     (void)SvPV_force(sv, origlen);
7873
7874     /* special-case "", "%s", and "%-p" (SVf - see below) */
7875     if (patlen == 0)
7876         return;
7877     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7878         if (args) {
7879             const char * const s = va_arg(*args, char*);
7880             sv_catpv(sv, s ? s : nullstr);
7881         }
7882         else if (svix < svmax) {
7883             sv_catsv(sv, *svargs);
7884         }
7885         return;
7886     }
7887     if (args && patlen == 3 && pat[0] == '%' &&
7888                 pat[1] == '-' && pat[2] == 'p') {
7889         argsv = va_arg(*args, SV*);
7890         sv_catsv(sv, argsv);
7891         return;
7892     }
7893
7894 #ifndef USE_LONG_DOUBLE
7895     /* special-case "%.<number>[gf]" */
7896     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7897          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7898         unsigned digits = 0;
7899         const char *pp;
7900
7901         pp = pat + 2;
7902         while (*pp >= '0' && *pp <= '9')
7903             digits = 10 * digits + (*pp++ - '0');
7904         if (pp - pat == (int)patlen - 1) {
7905             NV nv;
7906
7907             if (svix < svmax)
7908                 nv = SvNV(*svargs);
7909             else
7910                 return;
7911             if (*pp == 'g') {
7912                 /* Add check for digits != 0 because it seems that some
7913                    gconverts are buggy in this case, and we don't yet have
7914                    a Configure test for this.  */
7915                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7916                      /* 0, point, slack */
7917                     Gconvert(nv, (int)digits, 0, ebuf);
7918                     sv_catpv(sv, ebuf);
7919                     if (*ebuf)  /* May return an empty string for digits==0 */
7920                         return;
7921                 }
7922             } else if (!digits) {
7923                 STRLEN l;
7924
7925                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7926                     sv_catpvn(sv, p, l);
7927                     return;
7928                 }
7929             }
7930         }
7931     }
7932 #endif /* !USE_LONG_DOUBLE */
7933
7934     if (!args && svix < svmax && DO_UTF8(*svargs))
7935         has_utf8 = TRUE;
7936
7937     patend = (char*)pat + patlen;
7938     for (p = (char*)pat; p < patend; p = q) {
7939         bool alt = FALSE;
7940         bool left = FALSE;
7941         bool vectorize = FALSE;
7942         bool vectorarg = FALSE;
7943         bool vec_utf8 = FALSE;
7944         char fill = ' ';
7945         char plus = 0;
7946         char intsize = 0;
7947         STRLEN width = 0;
7948         STRLEN zeros = 0;
7949         bool has_precis = FALSE;
7950         STRLEN precis = 0;
7951         const I32 osvix = svix;
7952         bool is_utf8 = FALSE;  /* is this item utf8?   */
7953 #ifdef HAS_LDBL_SPRINTF_BUG
7954         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
7955            with sfio - Allen <allens@cpan.org> */
7956         bool fix_ldbl_sprintf_bug = FALSE;
7957 #endif
7958
7959         char esignbuf[4];
7960         U8 utf8buf[UTF8_MAXBYTES+1];
7961         STRLEN esignlen = 0;
7962
7963         const char *eptr = Nullch;
7964         STRLEN elen = 0;
7965         SV *vecsv = Nullsv;
7966         const U8 *vecstr = Null(U8*);
7967         STRLEN veclen = 0;
7968         char c = 0;
7969         int i;
7970         unsigned base = 0;
7971         IV iv = 0;
7972         UV uv = 0;
7973         /* we need a long double target in case HAS_LONG_DOUBLE but
7974            not USE_LONG_DOUBLE
7975         */
7976 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
7977         long double nv;
7978 #else
7979         NV nv;
7980 #endif
7981         STRLEN have;
7982         STRLEN need;
7983         STRLEN gap;
7984         const char *dotstr = ".";
7985         STRLEN dotstrlen = 1;
7986         I32 efix = 0; /* explicit format parameter index */
7987         I32 ewix = 0; /* explicit width index */
7988         I32 epix = 0; /* explicit precision index */
7989         I32 evix = 0; /* explicit vector index */
7990         bool asterisk = FALSE;
7991
7992         /* echo everything up to the next format specification */
7993         for (q = p; q < patend && *q != '%'; ++q) ;
7994         if (q > p) {
7995             if (has_utf8 && !pat_utf8)
7996                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
7997             else
7998                 sv_catpvn(sv, p, q - p);
7999             p = q;
8000         }
8001         if (q++ >= patend)
8002             break;
8003
8004 /*
8005     We allow format specification elements in this order:
8006         \d+\$              explicit format parameter index
8007         [-+ 0#]+           flags
8008         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
8009         0                  flag (as above): repeated to allow "v02"     
8010         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
8011         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
8012         [hlqLV]            size
8013     [%bcdefginopsuxDFOUX] format (mandatory)
8014 */
8015
8016         if (args) {
8017 /*  
8018         As of perl5.9.3, printf format checking is on by default.
8019         Internally, perl uses %p formats to provide an escape to
8020         some extended formatting.  This block deals with those
8021         extensions: if it does not match, (char*)q is reset and
8022         the normal format processing code is used.
8023
8024         Currently defined extensions are:
8025                 %p              include pointer address (standard)      
8026                 %-p     (SVf)   include an SV (previously %_)
8027                 %-<num>p        include an SV with precision <num>      
8028                 %1p     (VDf)   include a v-string (as %vd)
8029                 %<num>p         reserved for future extensions
8030
8031         Robin Barker 2005-07-14
8032 */
8033             char* r = q; 
8034             bool sv = FALSE;    
8035             STRLEN n = 0;
8036             if (*q == '-')
8037                 sv = *q++;
8038             n = expect_number(&q);
8039             if (*q++ == 'p') {
8040                 if (sv) {                       /* SVf */
8041                     if (n) {
8042                         precis = n;
8043                         has_precis = TRUE;
8044                     }
8045                     argsv = va_arg(*args, SV*);
8046                     eptr = SvPVx_const(argsv, elen);
8047                     if (DO_UTF8(argsv))
8048                         is_utf8 = TRUE;
8049                     goto string;
8050                 }
8051 #if vdNUMBER
8052                 else if (n == vdNUMBER) {       /* VDf */
8053                     vectorize = TRUE;
8054                     VECTORIZE_ARGS
8055                     goto format_vd;
8056                 }
8057 #endif
8058                 else if (n) {
8059                     if (ckWARN_d(WARN_INTERNAL))
8060                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
8061                         "internal %%<num>p might conflict with future printf extensions");
8062                 }
8063             }
8064             q = r; 
8065         }
8066
8067         if ( (width = expect_number(&q)) ) {
8068             if (*q == '$') {
8069                 ++q;
8070                 efix = width;
8071             } else {
8072                 goto gotwidth;
8073             }
8074         }
8075
8076         /* FLAGS */
8077
8078         while (*q) {
8079             switch (*q) {
8080             case ' ':
8081             case '+':
8082                 plus = *q++;
8083                 continue;
8084
8085             case '-':
8086                 left = TRUE;
8087                 q++;
8088                 continue;
8089
8090             case '0':
8091                 fill = *q++;
8092                 continue;
8093
8094             case '#':
8095                 alt = TRUE;
8096                 q++;
8097                 continue;
8098
8099             default:
8100                 break;
8101             }
8102             break;
8103         }
8104
8105       tryasterisk:
8106         if (*q == '*') {
8107             q++;
8108             if ( (ewix = expect_number(&q)) )
8109                 if (*q++ != '$')
8110                     goto unknown;
8111             asterisk = TRUE;
8112         }
8113         if (*q == 'v') {
8114             q++;
8115             if (vectorize)
8116                 goto unknown;
8117             if ((vectorarg = asterisk)) {
8118                 evix = ewix;
8119                 ewix = 0;
8120                 asterisk = FALSE;
8121             }
8122             vectorize = TRUE;
8123             goto tryasterisk;
8124         }
8125
8126         if (!asterisk)
8127         {
8128             if( *q == '0' )
8129                 fill = *q++;
8130             width = expect_number(&q);
8131         }
8132
8133         if (vectorize) {
8134             if (vectorarg) {
8135                 if (args)
8136                     vecsv = va_arg(*args, SV*);
8137                 else if (evix) {
8138                     vecsv = (evix > 0 && evix <= svmax)
8139                         ? svargs[evix-1] : &PL_sv_undef;
8140                 } else {
8141                     vecsv = svix < svmax ? svargs[svix++] : &PL_sv_undef;
8142                 }
8143                 dotstr = SvPV_const(vecsv, dotstrlen);
8144                 /* Keep the DO_UTF8 test *after* the SvPV call, else things go
8145                    bad with tied or overloaded values that return UTF8.  */
8146                 if (DO_UTF8(vecsv))
8147                     is_utf8 = TRUE;
8148                 else if (has_utf8) {
8149                     vecsv = sv_mortalcopy(vecsv);
8150                     sv_utf8_upgrade(vecsv);
8151                     dotstr = SvPV_const(vecsv, dotstrlen);
8152                     is_utf8 = TRUE;
8153                 }                   
8154             }
8155             if (args) {
8156                 VECTORIZE_ARGS
8157             }
8158             else if (efix ? (efix > 0 && efix <= svmax) : svix < svmax) {
8159                 vecsv = svargs[efix ? efix-1 : svix++];
8160                 vecstr = (U8*)SvPV_const(vecsv,veclen);
8161                 vec_utf8 = DO_UTF8(vecsv);
8162
8163                 /* if this is a version object, we need to convert
8164                  * back into v-string notation and then let the
8165                  * vectorize happen normally
8166                  */
8167                 if (sv_derived_from(vecsv, "version")) {
8168                     char *version = savesvpv(vecsv);
8169                     vecsv = sv_newmortal();
8170                     /* scan_vstring is expected to be called during
8171                      * tokenization, so we need to fake up the end
8172                      * of the buffer for it
8173                      */
8174                     PL_bufend = version + veclen;
8175                     scan_vstring(version, vecsv);
8176                     vecstr = (U8*)SvPV_const(vecsv, veclen);
8177                     vec_utf8 = DO_UTF8(vecsv);
8178                     Safefree(version);
8179                 }
8180             }
8181             else {
8182                 vecstr = (U8*)"";
8183                 veclen = 0;
8184             }
8185         }
8186
8187         if (asterisk) {
8188             if (args)
8189                 i = va_arg(*args, int);
8190             else
8191                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8192                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8193             left |= (i < 0);
8194             width = (i < 0) ? -i : i;
8195         }
8196       gotwidth:
8197
8198         /* PRECISION */
8199
8200         if (*q == '.') {
8201             q++;
8202             if (*q == '*') {
8203                 q++;
8204                 if ( ((epix = expect_number(&q))) && (*q++ != '$') )
8205                     goto unknown;
8206                 /* XXX: todo, support specified precision parameter */
8207                 if (epix)
8208                     goto unknown;
8209                 if (args)
8210                     i = va_arg(*args, int);
8211                 else
8212                     i = (ewix ? ewix <= svmax : svix < svmax)
8213                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8214                 precis = (i < 0) ? 0 : i;
8215             }
8216             else {
8217                 precis = 0;
8218                 while (isDIGIT(*q))
8219                     precis = precis * 10 + (*q++ - '0');
8220             }
8221             has_precis = TRUE;
8222         }
8223
8224         /* SIZE */
8225
8226         switch (*q) {
8227 #ifdef WIN32
8228         case 'I':                       /* Ix, I32x, and I64x */
8229 #  ifdef WIN64
8230             if (q[1] == '6' && q[2] == '4') {
8231                 q += 3;
8232                 intsize = 'q';
8233                 break;
8234             }
8235 #  endif
8236             if (q[1] == '3' && q[2] == '2') {
8237                 q += 3;
8238                 break;
8239             }
8240 #  ifdef WIN64
8241             intsize = 'q';
8242 #  endif
8243             q++;
8244             break;
8245 #endif
8246 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8247         case 'L':                       /* Ld */
8248             /* FALL THROUGH */
8249 #ifdef HAS_QUAD
8250         case 'q':                       /* qd */
8251 #endif
8252             intsize = 'q';
8253             q++;
8254             break;
8255 #endif
8256         case 'l':
8257 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8258             if (*(q + 1) == 'l') {      /* lld, llf */
8259                 intsize = 'q';
8260                 q += 2;
8261                 break;
8262              }
8263 #endif
8264             /* FALL THROUGH */
8265         case 'h':
8266             /* FALL THROUGH */
8267         case 'V':
8268             intsize = *q++;
8269             break;
8270         }
8271
8272         /* CONVERSION */
8273
8274         if (*q == '%') {
8275             eptr = q++;
8276             elen = 1;
8277             if (vectorize) {
8278                 c = '%';
8279                 goto unknown;
8280             }
8281             goto string;
8282         }
8283
8284         if (!vectorize && !args) {
8285             if (efix) {
8286                 const I32 i = efix-1;
8287                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8288             } else {
8289                 argsv = (svix >= 0 && svix < svmax)
8290                     ? svargs[svix++] : &PL_sv_undef;
8291             }
8292         }
8293
8294         switch (c = *q++) {
8295
8296             /* STRINGS */
8297
8298         case 'c':
8299             if (vectorize)
8300                 goto unknown;
8301             uv = (args) ? va_arg(*args, int) : SvIVx(argsv);
8302             if ((uv > 255 ||
8303                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8304                 && !IN_BYTES) {
8305                 eptr = (char*)utf8buf;
8306                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8307                 is_utf8 = TRUE;
8308             }
8309             else {
8310                 c = (char)uv;
8311                 eptr = &c;
8312                 elen = 1;
8313             }
8314             goto string;
8315
8316         case 's':
8317             if (vectorize)
8318                 goto unknown;
8319             if (args) {
8320                 eptr = va_arg(*args, char*);
8321                 if (eptr)
8322 #ifdef MACOS_TRADITIONAL
8323                   /* On MacOS, %#s format is used for Pascal strings */
8324                   if (alt)
8325                     elen = *eptr++;
8326                   else
8327 #endif
8328                     elen = strlen(eptr);
8329                 else {
8330                     eptr = (char *)nullstr;
8331                     elen = sizeof nullstr - 1;
8332                 }
8333             }
8334             else {
8335                 eptr = SvPVx_const(argsv, elen);
8336                 if (DO_UTF8(argsv)) {
8337                     if (has_precis && precis < elen) {
8338                         I32 p = precis;
8339                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8340                         precis = p;
8341                     }
8342                     if (width) { /* fudge width (can't fudge elen) */
8343                         width += elen - sv_len_utf8(argsv);
8344                     }
8345                     is_utf8 = TRUE;
8346                 }
8347             }
8348
8349         string:
8350             if (has_precis && elen > precis)
8351                 elen = precis;
8352             break;
8353
8354             /* INTEGERS */
8355
8356         case 'p':
8357             if (alt || vectorize)
8358                 goto unknown;
8359             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8360             base = 16;
8361             goto integer;
8362
8363         case 'D':
8364 #ifdef IV_IS_QUAD
8365             intsize = 'q';
8366 #else
8367             intsize = 'l';
8368 #endif
8369             /* FALL THROUGH */
8370         case 'd':
8371         case 'i':
8372 #if vdNUMBER
8373         format_vd:
8374 #endif
8375             if (vectorize) {
8376                 STRLEN ulen;
8377                 if (!veclen)
8378                     continue;
8379                 if (vec_utf8)
8380                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8381                                         UTF8_ALLOW_ANYUV);
8382                 else {
8383                     uv = *vecstr;
8384                     ulen = 1;
8385                 }
8386                 vecstr += ulen;
8387                 veclen -= ulen;
8388                 if (plus)
8389                      esignbuf[esignlen++] = plus;
8390             }
8391             else if (args) {
8392                 switch (intsize) {
8393                 case 'h':       iv = (short)va_arg(*args, int); break;
8394                 case 'l':       iv = va_arg(*args, long); break;
8395                 case 'V':       iv = va_arg(*args, IV); break;
8396                 default:        iv = va_arg(*args, int); break;
8397 #ifdef HAS_QUAD
8398                 case 'q':       iv = va_arg(*args, Quad_t); break;
8399 #endif
8400                 }
8401             }
8402             else {
8403                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8404                 switch (intsize) {
8405                 case 'h':       iv = (short)tiv; break;
8406                 case 'l':       iv = (long)tiv; break;
8407                 case 'V':
8408                 default:        iv = tiv; break;
8409 #ifdef HAS_QUAD
8410                 case 'q':       iv = (Quad_t)tiv; break;
8411 #endif
8412                 }
8413             }
8414             if ( !vectorize )   /* we already set uv above */
8415             {
8416                 if (iv >= 0) {
8417                     uv = iv;
8418                     if (plus)
8419                         esignbuf[esignlen++] = plus;
8420                 }
8421                 else {
8422                     uv = -iv;
8423                     esignbuf[esignlen++] = '-';
8424                 }
8425             }
8426             base = 10;
8427             goto integer;
8428
8429         case 'U':
8430 #ifdef IV_IS_QUAD
8431             intsize = 'q';
8432 #else
8433             intsize = 'l';
8434 #endif
8435             /* FALL THROUGH */
8436         case 'u':
8437             base = 10;
8438             goto uns_integer;
8439
8440         case 'b':
8441             base = 2;
8442             goto uns_integer;
8443
8444         case 'O':
8445 #ifdef IV_IS_QUAD
8446             intsize = 'q';
8447 #else
8448             intsize = 'l';
8449 #endif
8450             /* FALL THROUGH */
8451         case 'o':
8452             base = 8;
8453             goto uns_integer;
8454
8455         case 'X':
8456         case 'x':
8457             base = 16;
8458
8459         uns_integer:
8460             if (vectorize) {
8461                 STRLEN ulen;
8462         vector:
8463                 if (!veclen)
8464                     continue;
8465                 if (vec_utf8)
8466                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8467                                         UTF8_ALLOW_ANYUV);
8468                 else {
8469                     uv = *vecstr;
8470                     ulen = 1;
8471                 }
8472                 vecstr += ulen;
8473                 veclen -= ulen;
8474             }
8475             else if (args) {
8476                 switch (intsize) {
8477                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8478                 case 'l':  uv = va_arg(*args, unsigned long); break;
8479                 case 'V':  uv = va_arg(*args, UV); break;
8480                 default:   uv = va_arg(*args, unsigned); break;
8481 #ifdef HAS_QUAD
8482                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8483 #endif
8484                 }
8485             }
8486             else {
8487                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8488                 switch (intsize) {
8489                 case 'h':       uv = (unsigned short)tuv; break;
8490                 case 'l':       uv = (unsigned long)tuv; break;
8491                 case 'V':
8492                 default:        uv = tuv; break;
8493 #ifdef HAS_QUAD
8494                 case 'q':       uv = (Uquad_t)tuv; break;
8495 #endif
8496                 }
8497             }
8498
8499         integer:
8500             {
8501                 char *ptr = ebuf + sizeof ebuf;
8502                 switch (base) {
8503                     unsigned dig;
8504                 case 16:
8505                     if (!uv)
8506                         alt = FALSE;
8507                     p = (char*)((c == 'X')
8508                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8509                     do {
8510                         dig = uv & 15;
8511                         *--ptr = p[dig];
8512                     } while (uv >>= 4);
8513                     if (alt) {
8514                         esignbuf[esignlen++] = '0';
8515                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8516                     }
8517                     break;
8518                 case 8:
8519                     do {
8520                         dig = uv & 7;
8521                         *--ptr = '0' + dig;
8522                     } while (uv >>= 3);
8523                     if (alt && *ptr != '0')
8524                         *--ptr = '0';
8525                     break;
8526                 case 2:
8527                     if (!uv)
8528                         alt = FALSE;
8529                     do {
8530                         dig = uv & 1;
8531                         *--ptr = '0' + dig;
8532                     } while (uv >>= 1);
8533                     if (alt) {
8534                         esignbuf[esignlen++] = '0';
8535                         esignbuf[esignlen++] = 'b';
8536                     }
8537                     break;
8538                 default:                /* it had better be ten or less */
8539                     do {
8540                         dig = uv % base;
8541                         *--ptr = '0' + dig;
8542                     } while (uv /= base);
8543                     break;
8544                 }
8545                 elen = (ebuf + sizeof ebuf) - ptr;
8546                 eptr = ptr;
8547                 if (has_precis) {
8548                     if (precis > elen)
8549                         zeros = precis - elen;
8550                     else if (precis == 0 && elen == 1 && *eptr == '0')
8551                         elen = 0;
8552                 }
8553             }
8554             break;
8555
8556             /* FLOATING POINT */
8557
8558         case 'F':
8559             c = 'f';            /* maybe %F isn't supported here */
8560             /* FALL THROUGH */
8561         case 'e': case 'E':
8562         case 'f':
8563         case 'g': case 'G':
8564             if (vectorize)
8565                 goto unknown;
8566
8567             /* This is evil, but floating point is even more evil */
8568
8569             /* for SV-style calling, we can only get NV
8570                for C-style calling, we assume %f is double;
8571                for simplicity we allow any of %Lf, %llf, %qf for long double
8572             */
8573             switch (intsize) {
8574             case 'V':
8575 #if defined(USE_LONG_DOUBLE)
8576                 intsize = 'q';
8577 #endif
8578                 break;
8579 /* [perl #20339] - we should accept and ignore %lf rather than die */
8580             case 'l':
8581                 /* FALL THROUGH */
8582             default:
8583 #if defined(USE_LONG_DOUBLE)
8584                 intsize = args ? 0 : 'q';
8585 #endif
8586                 break;
8587             case 'q':
8588 #if defined(HAS_LONG_DOUBLE)
8589                 break;
8590 #else
8591                 /* FALL THROUGH */
8592 #endif
8593             case 'h':
8594                 goto unknown;
8595             }
8596
8597             /* now we need (long double) if intsize == 'q', else (double) */
8598             nv = (args) ?
8599 #if LONG_DOUBLESIZE > DOUBLESIZE
8600                 intsize == 'q' ?
8601                     va_arg(*args, long double) :
8602                     va_arg(*args, double)
8603 #else
8604                     va_arg(*args, double)
8605 #endif
8606                 : SvNVx(argsv);
8607
8608             need = 0;
8609             if (c != 'e' && c != 'E') {
8610                 i = PERL_INT_MIN;
8611                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8612                    will cast our (long double) to (double) */
8613                 (void)Perl_frexp(nv, &i);
8614                 if (i == PERL_INT_MIN)
8615                     Perl_die(aTHX_ "panic: frexp");
8616                 if (i > 0)
8617                     need = BIT_DIGITS(i);
8618             }
8619             need += has_precis ? precis : 6; /* known default */
8620
8621             if (need < width)
8622                 need = width;
8623
8624 #ifdef HAS_LDBL_SPRINTF_BUG
8625             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8626                with sfio - Allen <allens@cpan.org> */
8627
8628 #  ifdef DBL_MAX
8629 #    define MY_DBL_MAX DBL_MAX
8630 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8631 #    if DOUBLESIZE >= 8
8632 #      define MY_DBL_MAX 1.7976931348623157E+308L
8633 #    else
8634 #      define MY_DBL_MAX 3.40282347E+38L
8635 #    endif
8636 #  endif
8637
8638 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8639 #    define MY_DBL_MAX_BUG 1L
8640 #  else
8641 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8642 #  endif
8643
8644 #  ifdef DBL_MIN
8645 #    define MY_DBL_MIN DBL_MIN
8646 #  else  /* XXX guessing! -Allen */
8647 #    if DOUBLESIZE >= 8
8648 #      define MY_DBL_MIN 2.2250738585072014E-308L
8649 #    else
8650 #      define MY_DBL_MIN 1.17549435E-38L
8651 #    endif
8652 #  endif
8653
8654             if ((intsize == 'q') && (c == 'f') &&
8655                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8656                 (need < DBL_DIG)) {
8657                 /* it's going to be short enough that
8658                  * long double precision is not needed */
8659
8660                 if ((nv <= 0L) && (nv >= -0L))
8661                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8662                 else {
8663                     /* would use Perl_fp_class as a double-check but not
8664                      * functional on IRIX - see perl.h comments */
8665
8666                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8667                         /* It's within the range that a double can represent */
8668 #if defined(DBL_MAX) && !defined(DBL_MIN)
8669                         if ((nv >= ((long double)1/DBL_MAX)) ||
8670                             (nv <= (-(long double)1/DBL_MAX)))
8671 #endif
8672                         fix_ldbl_sprintf_bug = TRUE;
8673                     }
8674                 }
8675                 if (fix_ldbl_sprintf_bug == TRUE) {
8676                     double temp;
8677
8678                     intsize = 0;
8679                     temp = (double)nv;
8680                     nv = (NV)temp;
8681                 }
8682             }
8683
8684 #  undef MY_DBL_MAX
8685 #  undef MY_DBL_MAX_BUG
8686 #  undef MY_DBL_MIN
8687
8688 #endif /* HAS_LDBL_SPRINTF_BUG */
8689
8690             need += 20; /* fudge factor */
8691             if (PL_efloatsize < need) {
8692                 Safefree(PL_efloatbuf);
8693                 PL_efloatsize = need + 20; /* more fudge */
8694                 Newx(PL_efloatbuf, PL_efloatsize, char);
8695                 PL_efloatbuf[0] = '\0';
8696             }
8697
8698             if ( !(width || left || plus || alt) && fill != '0'
8699                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8700                 /* See earlier comment about buggy Gconvert when digits,
8701                    aka precis is 0  */
8702                 if ( c == 'g' && precis) {
8703                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8704                     /* May return an empty string for digits==0 */
8705                     if (*PL_efloatbuf) {
8706                         elen = strlen(PL_efloatbuf);
8707                         goto float_converted;
8708                     }
8709                 } else if ( c == 'f' && !precis) {
8710                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8711                         break;
8712                 }
8713             }
8714             {
8715                 char *ptr = ebuf + sizeof ebuf;
8716                 *--ptr = '\0';
8717                 *--ptr = c;
8718                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8719 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8720                 if (intsize == 'q') {
8721                     /* Copy the one or more characters in a long double
8722                      * format before the 'base' ([efgEFG]) character to
8723                      * the format string. */
8724                     static char const prifldbl[] = PERL_PRIfldbl;
8725                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8726                     while (p >= prifldbl) { *--ptr = *p--; }
8727                 }
8728 #endif
8729                 if (has_precis) {
8730                     base = precis;
8731                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8732                     *--ptr = '.';
8733                 }
8734                 if (width) {
8735                     base = width;
8736                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8737                 }
8738                 if (fill == '0')
8739                     *--ptr = fill;
8740                 if (left)
8741                     *--ptr = '-';
8742                 if (plus)
8743                     *--ptr = plus;
8744                 if (alt)
8745                     *--ptr = '#';
8746                 *--ptr = '%';
8747
8748                 /* No taint.  Otherwise we are in the strange situation
8749                  * where printf() taints but print($float) doesn't.
8750                  * --jhi */
8751 #if defined(HAS_LONG_DOUBLE)
8752                 elen = ((intsize == 'q')
8753                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8754                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8755 #else
8756                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8757 #endif
8758             }
8759         float_converted:
8760             eptr = PL_efloatbuf;
8761             break;
8762
8763             /* SPECIAL */
8764
8765         case 'n':
8766             if (vectorize)
8767                 goto unknown;
8768             i = SvCUR(sv) - origlen;
8769             if (args) {
8770                 switch (intsize) {
8771                 case 'h':       *(va_arg(*args, short*)) = i; break;
8772                 default:        *(va_arg(*args, int*)) = i; break;
8773                 case 'l':       *(va_arg(*args, long*)) = i; break;
8774                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8775 #ifdef HAS_QUAD
8776                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8777 #endif
8778                 }
8779             }
8780             else
8781                 sv_setuv_mg(argsv, (UV)i);
8782             continue;   /* not "break" */
8783
8784             /* UNKNOWN */
8785
8786         default:
8787       unknown:
8788             if (!args
8789                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8790                 && ckWARN(WARN_PRINTF))
8791             {
8792                 SV * const msg = sv_newmortal();
8793                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8794                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8795                 if (c) {
8796                     if (isPRINT(c))
8797                         Perl_sv_catpvf(aTHX_ msg,
8798                                        "\"%%%c\"", c & 0xFF);
8799                     else
8800                         Perl_sv_catpvf(aTHX_ msg,
8801                                        "\"%%\\%03"UVof"\"",
8802                                        (UV)c & 0xFF);
8803                 } else
8804                     sv_catpvs(msg, "end of string");
8805                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8806             }
8807
8808             /* output mangled stuff ... */
8809             if (c == '\0')
8810                 --q;
8811             eptr = p;
8812             elen = q - p;
8813
8814             /* ... right here, because formatting flags should not apply */
8815             SvGROW(sv, SvCUR(sv) + elen + 1);
8816             p = SvEND(sv);
8817             Copy(eptr, p, elen, char);
8818             p += elen;
8819             *p = '\0';
8820             SvCUR_set(sv, p - SvPVX_const(sv));
8821             svix = osvix;
8822             continue;   /* not "break" */
8823         }
8824
8825         /* calculate width before utf8_upgrade changes it */
8826         have = esignlen + zeros + elen;
8827         if (have < zeros)
8828             Perl_croak_nocontext(PL_memory_wrap);
8829
8830         if (is_utf8 != has_utf8) {
8831              if (is_utf8) {
8832                   if (SvCUR(sv))
8833                        sv_utf8_upgrade(sv);
8834              }
8835              else {
8836                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8837                   sv_utf8_upgrade(nsv);
8838                   eptr = SvPVX_const(nsv);
8839                   elen = SvCUR(nsv);
8840              }
8841              SvGROW(sv, SvCUR(sv) + elen + 1);
8842              p = SvEND(sv);
8843              *p = '\0';
8844         }
8845
8846         need = (have > width ? have : width);
8847         gap = need - have;
8848
8849         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8850             Perl_croak_nocontext(PL_memory_wrap);
8851         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8852         p = SvEND(sv);
8853         if (esignlen && fill == '0') {
8854             int i;
8855             for (i = 0; i < (int)esignlen; i++)
8856                 *p++ = esignbuf[i];
8857         }
8858         if (gap && !left) {
8859             memset(p, fill, gap);
8860             p += gap;
8861         }
8862         if (esignlen && fill != '0') {
8863             int i;
8864             for (i = 0; i < (int)esignlen; i++)
8865                 *p++ = esignbuf[i];
8866         }
8867         if (zeros) {
8868             int i;
8869             for (i = zeros; i; i--)
8870                 *p++ = '0';
8871         }
8872         if (elen) {
8873             Copy(eptr, p, elen, char);
8874             p += elen;
8875         }
8876         if (gap && left) {
8877             memset(p, ' ', gap);
8878             p += gap;
8879         }
8880         if (vectorize) {
8881             if (veclen) {
8882                 Copy(dotstr, p, dotstrlen, char);
8883                 p += dotstrlen;
8884             }
8885             else
8886                 vectorize = FALSE;              /* done iterating over vecstr */
8887         }
8888         if (is_utf8)
8889             has_utf8 = TRUE;
8890         if (has_utf8)
8891             SvUTF8_on(sv);
8892         *p = '\0';
8893         SvCUR_set(sv, p - SvPVX_const(sv));
8894         if (vectorize) {
8895             esignlen = 0;
8896             goto vector;
8897         }
8898     }
8899 }
8900
8901 /* =========================================================================
8902
8903 =head1 Cloning an interpreter
8904
8905 All the macros and functions in this section are for the private use of
8906 the main function, perl_clone().
8907
8908 The foo_dup() functions make an exact copy of an existing foo thinngy.
8909 During the course of a cloning, a hash table is used to map old addresses
8910 to new addresses. The table is created and manipulated with the
8911 ptr_table_* functions.
8912
8913 =cut
8914
8915 ============================================================================*/
8916
8917
8918 #if defined(USE_ITHREADS)
8919
8920 #ifndef GpREFCNT_inc
8921 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8922 #endif
8923
8924
8925 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8926 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8927 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8928 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8929 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8930 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8931 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8932 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8933 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8934 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8935 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8936 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8937 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8938
8939
8940 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8941    regcomp.c. AMS 20010712 */
8942
8943 REGEXP *
8944 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8945 {
8946     dVAR;
8947     REGEXP *ret;
8948     int i, len, npar;
8949     struct reg_substr_datum *s;
8950
8951     if (!r)
8952         return (REGEXP *)NULL;
8953
8954     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8955         return ret;
8956
8957     len = r->offsets[0];
8958     npar = r->nparens+1;
8959
8960     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8961     Copy(r->program, ret->program, len+1, regnode);
8962
8963     Newx(ret->startp, npar, I32);
8964     Copy(r->startp, ret->startp, npar, I32);
8965     Newx(ret->endp, npar, I32);
8966     Copy(r->startp, ret->startp, npar, I32);
8967
8968     Newx(ret->substrs, 1, struct reg_substr_data);
8969     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
8970         s->min_offset = r->substrs->data[i].min_offset;
8971         s->max_offset = r->substrs->data[i].max_offset;
8972         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
8973         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
8974     }
8975
8976     ret->regstclass = NULL;
8977     if (r->data) {
8978         struct reg_data *d;
8979         const int count = r->data->count;
8980         int i;
8981
8982         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
8983                 char, struct reg_data);
8984         Newx(d->what, count, U8);
8985
8986         d->count = count;
8987         for (i = 0; i < count; i++) {
8988             d->what[i] = r->data->what[i];
8989             switch (d->what[i]) {
8990                 /* legal options are one of: sfpont
8991                    see also regcomp.h and pregfree() */
8992             case 's':
8993                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
8994                 break;
8995             case 'p':
8996                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
8997                 break;
8998             case 'f':
8999                 /* This is cheating. */
9000                 Newx(d->data[i], 1, struct regnode_charclass_class);
9001                 StructCopy(r->data->data[i], d->data[i],
9002                             struct regnode_charclass_class);
9003                 ret->regstclass = (regnode*)d->data[i];
9004                 break;
9005             case 'o':
9006                 /* Compiled op trees are readonly, and can thus be
9007                    shared without duplication. */
9008                 OP_REFCNT_LOCK;
9009                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
9010                 OP_REFCNT_UNLOCK;
9011                 break;
9012             case 'n':
9013                 d->data[i] = r->data->data[i];
9014                 break;
9015             case 't':
9016                 d->data[i] = r->data->data[i];
9017                 OP_REFCNT_LOCK;
9018                 ((reg_trie_data*)d->data[i])->refcount++;
9019                 OP_REFCNT_UNLOCK;
9020                 break;
9021             default:
9022                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
9023             }
9024         }
9025
9026         ret->data = d;
9027     }
9028     else
9029         ret->data = NULL;
9030
9031     Newx(ret->offsets, 2*len+1, U32);
9032     Copy(r->offsets, ret->offsets, 2*len+1, U32);
9033
9034     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
9035     ret->refcnt         = r->refcnt;
9036     ret->minlen         = r->minlen;
9037     ret->prelen         = r->prelen;
9038     ret->nparens        = r->nparens;
9039     ret->lastparen      = r->lastparen;
9040     ret->lastcloseparen = r->lastcloseparen;
9041     ret->reganch        = r->reganch;
9042
9043     ret->sublen         = r->sublen;
9044
9045     if (RX_MATCH_COPIED(ret))
9046         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
9047     else
9048         ret->subbeg = Nullch;
9049 #ifdef PERL_OLD_COPY_ON_WRITE
9050     ret->saved_copy = Nullsv;
9051 #endif
9052
9053     ptr_table_store(PL_ptr_table, r, ret);
9054     return ret;
9055 }
9056
9057 /* duplicate a file handle */
9058
9059 PerlIO *
9060 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
9061 {
9062     PerlIO *ret;
9063
9064     PERL_UNUSED_ARG(type);
9065
9066     if (!fp)
9067         return (PerlIO*)NULL;
9068
9069     /* look for it in the table first */
9070     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
9071     if (ret)
9072         return ret;
9073
9074     /* create anew and remember what it is */
9075     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
9076     ptr_table_store(PL_ptr_table, fp, ret);
9077     return ret;
9078 }
9079
9080 /* duplicate a directory handle */
9081
9082 DIR *
9083 Perl_dirp_dup(pTHX_ DIR *dp)
9084 {
9085     if (!dp)
9086         return (DIR*)NULL;
9087     /* XXX TODO */
9088     return dp;
9089 }
9090
9091 /* duplicate a typeglob */
9092
9093 GP *
9094 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
9095 {
9096     GP *ret;
9097     if (!gp)
9098         return (GP*)NULL;
9099     /* look for it in the table first */
9100     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
9101     if (ret)
9102         return ret;
9103
9104     /* create anew and remember what it is */
9105     Newxz(ret, 1, GP);
9106     ptr_table_store(PL_ptr_table, gp, ret);
9107
9108     /* clone */
9109     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
9110     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
9111     ret->gp_io          = io_dup_inc(gp->gp_io, param);
9112     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
9113     ret->gp_av          = av_dup_inc(gp->gp_av, param);
9114     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
9115     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
9116     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
9117     ret->gp_cvgen       = gp->gp_cvgen;
9118     ret->gp_line        = gp->gp_line;
9119     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
9120     return ret;
9121 }
9122
9123 /* duplicate a chain of magic */
9124
9125 MAGIC *
9126 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
9127 {
9128     MAGIC *mgprev = (MAGIC*)NULL;
9129     MAGIC *mgret;
9130     if (!mg)
9131         return (MAGIC*)NULL;
9132     /* look for it in the table first */
9133     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
9134     if (mgret)
9135         return mgret;
9136
9137     for (; mg; mg = mg->mg_moremagic) {
9138         MAGIC *nmg;
9139         Newxz(nmg, 1, MAGIC);
9140         if (mgprev)
9141             mgprev->mg_moremagic = nmg;
9142         else
9143             mgret = nmg;
9144         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
9145         nmg->mg_private = mg->mg_private;
9146         nmg->mg_type    = mg->mg_type;
9147         nmg->mg_flags   = mg->mg_flags;
9148         if (mg->mg_type == PERL_MAGIC_qr) {
9149             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
9150         }
9151         else if(mg->mg_type == PERL_MAGIC_backref) {
9152             /* The backref AV has its reference count deliberately bumped by
9153                1.  */
9154             nmg->mg_obj = SvREFCNT_inc(av_dup_inc((AV*) mg->mg_obj, param));
9155         }
9156         else if (mg->mg_type == PERL_MAGIC_symtab) {
9157             nmg->mg_obj = mg->mg_obj;
9158         }
9159         else {
9160             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9161                               ? sv_dup_inc(mg->mg_obj, param)
9162                               : sv_dup(mg->mg_obj, param);
9163         }
9164         nmg->mg_len     = mg->mg_len;
9165         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9166         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9167             if (mg->mg_len > 0) {
9168                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9169                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9170                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9171                 {
9172                     const AMT * const amtp = (AMT*)mg->mg_ptr;
9173                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9174                     I32 i;
9175                     for (i = 1; i < NofAMmeth; i++) {
9176                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9177                     }
9178                 }
9179             }
9180             else if (mg->mg_len == HEf_SVKEY)
9181                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9182         }
9183         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9184             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9185         }
9186         mgprev = nmg;
9187     }
9188     return mgret;
9189 }
9190
9191 /* create a new pointer-mapping table */
9192
9193 PTR_TBL_t *
9194 Perl_ptr_table_new(pTHX)
9195 {
9196     PTR_TBL_t *tbl;
9197     Newxz(tbl, 1, PTR_TBL_t);
9198     tbl->tbl_max        = 511;
9199     tbl->tbl_items      = 0;
9200     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9201     return tbl;
9202 }
9203
9204 #define PTR_TABLE_HASH(ptr) \
9205   ((PTR2UV(ptr) >> 3) ^ (PTR2UV(ptr) >> (3 + 7)) ^ (PTR2UV(ptr) >> (3 + 17)))
9206
9207 /* 
9208    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9209    following define) and at call to new_body_inline made below in 
9210    Perl_ptr_table_store()
9211  */
9212
9213 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9214
9215 /* map an existing pointer using a table */
9216
9217 STATIC PTR_TBL_ENT_t *
9218 S_ptr_table_find(pTHX_ PTR_TBL_t *tbl, const void *sv) {
9219     PTR_TBL_ENT_t *tblent;
9220     const UV hash = PTR_TABLE_HASH(sv);
9221     assert(tbl);
9222     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9223     for (; tblent; tblent = tblent->next) {
9224         if (tblent->oldval == sv)
9225             return tblent;
9226     }
9227     return 0;
9228 }
9229
9230 void *
9231 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9232 {
9233     PTR_TBL_ENT_t const *const tblent = S_ptr_table_find(aTHX_ tbl, sv);
9234     return tblent ? tblent->newval : (void *) 0;
9235 }
9236
9237 /* add a new entry to a pointer-mapping table */
9238
9239 void
9240 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9241 {
9242     PTR_TBL_ENT_t *tblent = S_ptr_table_find(aTHX_ tbl, oldsv);
9243
9244     if (tblent) {
9245         tblent->newval = newsv;
9246     } else {
9247         const UV entry = PTR_TABLE_HASH(oldsv) & tbl->tbl_max;
9248
9249         new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9250         tblent->oldval = oldsv;
9251         tblent->newval = newsv;
9252         tblent->next = tbl->tbl_ary[entry];
9253         tbl->tbl_ary[entry] = tblent;
9254         tbl->tbl_items++;
9255         if (tblent->next && tbl->tbl_items > tbl->tbl_max)
9256             ptr_table_split(tbl);
9257     }
9258 }
9259
9260 /* double the hash bucket size of an existing ptr table */
9261
9262 void
9263 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9264 {
9265     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9266     const UV oldsize = tbl->tbl_max + 1;
9267     UV newsize = oldsize * 2;
9268     UV i;
9269
9270     Renew(ary, newsize, PTR_TBL_ENT_t*);
9271     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9272     tbl->tbl_max = --newsize;
9273     tbl->tbl_ary = ary;
9274     for (i=0; i < oldsize; i++, ary++) {
9275         PTR_TBL_ENT_t **curentp, **entp, *ent;
9276         if (!*ary)
9277             continue;
9278         curentp = ary + oldsize;
9279         for (entp = ary, ent = *ary; ent; ent = *entp) {
9280             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9281                 *entp = ent->next;
9282                 ent->next = *curentp;
9283                 *curentp = ent;
9284                 continue;
9285             }
9286             else
9287                 entp = &ent->next;
9288         }
9289     }
9290 }
9291
9292 /* remove all the entries from a ptr table */
9293
9294 void
9295 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9296 {
9297     if (tbl && tbl->tbl_items) {
9298         register PTR_TBL_ENT_t * const * const array = tbl->tbl_ary;
9299         UV riter = tbl->tbl_max;
9300
9301         do {
9302             PTR_TBL_ENT_t *entry = array[riter];
9303
9304             while (entry) {
9305                 PTR_TBL_ENT_t * const oentry = entry;
9306                 entry = entry->next;
9307                 del_pte(oentry);
9308             }
9309         } while (riter--);
9310
9311         tbl->tbl_items = 0;
9312     }
9313 }
9314
9315 /* clear and free a ptr table */
9316
9317 void
9318 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9319 {
9320     if (!tbl) {
9321         return;
9322     }
9323     ptr_table_clear(tbl);
9324     Safefree(tbl->tbl_ary);
9325     Safefree(tbl);
9326 }
9327
9328
9329 void
9330 Perl_rvpv_dup(pTHX_ SV *dstr, const SV *sstr, CLONE_PARAMS* param)
9331 {
9332     if (SvROK(sstr)) {
9333         SvRV_set(dstr, SvWEAKREF(sstr)
9334                        ? sv_dup(SvRV(sstr), param)
9335                        : sv_dup_inc(SvRV(sstr), param));
9336
9337     }
9338     else if (SvPVX_const(sstr)) {
9339         /* Has something there */
9340         if (SvLEN(sstr)) {
9341             /* Normal PV - clone whole allocated space */
9342             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9343             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9344                 /* Not that normal - actually sstr is copy on write.
9345                    But we are a true, independant SV, so:  */
9346                 SvREADONLY_off(dstr);
9347                 SvFAKE_off(dstr);
9348             }
9349         }
9350         else {
9351             /* Special case - not normally malloced for some reason */
9352             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9353                 /* A "shared" PV - clone it as "shared" PV */
9354                 SvPV_set(dstr,
9355                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9356                                          param)));
9357             }
9358             else {
9359                 /* Some other special case - random pointer */
9360                 SvPV_set(dstr, SvPVX(sstr));            
9361             }
9362         }
9363     }
9364     else {
9365         /* Copy the Null */
9366         if (SvTYPE(dstr) == SVt_RV)
9367             SvRV_set(dstr, NULL);
9368         else
9369             SvPV_set(dstr, 0);
9370     }
9371 }
9372
9373 /* duplicate an SV of any type (including AV, HV etc) */
9374
9375 SV *
9376 Perl_sv_dup(pTHX_ const SV *sstr, CLONE_PARAMS* param)
9377 {
9378     dVAR;
9379     SV *dstr;
9380
9381     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9382         return Nullsv;
9383     /* look for it in the table first */
9384     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9385     if (dstr)
9386         return dstr;
9387
9388     if(param->flags & CLONEf_JOIN_IN) {
9389         /** We are joining here so we don't want do clone
9390             something that is bad **/
9391         if (SvTYPE(sstr) == SVt_PVHV) {
9392             const char * const hvname = HvNAME_get(sstr);
9393             if (hvname)
9394                 /** don't clone stashes if they already exist **/
9395                 return (SV*)gv_stashpv(hvname,0);
9396         }
9397     }
9398
9399     /* create anew and remember what it is */
9400     new_SV(dstr);
9401
9402 #ifdef DEBUG_LEAKING_SCALARS
9403     dstr->sv_debug_optype = sstr->sv_debug_optype;
9404     dstr->sv_debug_line = sstr->sv_debug_line;
9405     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9406     dstr->sv_debug_cloned = 1;
9407     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9408 #endif
9409
9410     ptr_table_store(PL_ptr_table, sstr, dstr);
9411
9412     /* clone */
9413     SvFLAGS(dstr)       = SvFLAGS(sstr);
9414     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9415     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9416
9417 #ifdef DEBUGGING
9418     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9419         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9420                       PL_watch_pvx, SvPVX_const(sstr));
9421 #endif
9422
9423     /* don't clone objects whose class has asked us not to */
9424     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9425         SvFLAGS(dstr) &= ~SVTYPEMASK;
9426         SvOBJECT_off(dstr);
9427         return dstr;
9428     }
9429
9430     switch (SvTYPE(sstr)) {
9431     case SVt_NULL:
9432         SvANY(dstr)     = NULL;
9433         break;
9434     case SVt_IV:
9435         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9436         SvIV_set(dstr, SvIVX(sstr));
9437         break;
9438     case SVt_NV:
9439         SvANY(dstr)     = new_XNV();
9440         SvNV_set(dstr, SvNVX(sstr));
9441         break;
9442     case SVt_RV:
9443         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9444         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9445         break;
9446     default:
9447         {
9448             /* These are all the types that need complex bodies allocating.  */
9449             void *new_body;
9450             const svtype sv_type = SvTYPE(sstr);
9451             const struct body_details *const sv_type_details
9452                 = bodies_by_type + sv_type;
9453
9454             switch (sv_type) {
9455             default:
9456                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9457                            (IV)SvTYPE(sstr));
9458                 break;
9459
9460             case SVt_PVGV:
9461                 if (GvUNIQUE((GV*)sstr)) {
9462                     /* Do sharing here, and fall through */
9463                 }
9464             case SVt_PVIO:
9465             case SVt_PVFM:
9466             case SVt_PVHV:
9467             case SVt_PVAV:
9468             case SVt_PVBM:
9469             case SVt_PVCV:
9470             case SVt_PVLV:
9471             case SVt_PVMG:
9472             case SVt_PVNV:
9473             case SVt_PVIV:
9474             case SVt_PV:
9475                 assert(sv_type_details->size);
9476                 if (sv_type_details->arena) {
9477                     new_body_inline(new_body, sv_type_details->size, sv_type);
9478                     new_body
9479                         = (void*)((char*)new_body - sv_type_details->offset);
9480                 } else {
9481                     new_body = new_NOARENA(sv_type_details);
9482                 }
9483             }
9484             assert(new_body);
9485             SvANY(dstr) = new_body;
9486
9487 #ifndef PURIFY
9488             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9489                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9490                  sv_type_details->copy, char);
9491 #else
9492             Copy(((char*)SvANY(sstr)),
9493                  ((char*)SvANY(dstr)),
9494                  sv_type_details->size + sv_type_details->offset, char);
9495 #endif
9496
9497             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9498                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9499
9500             /* The Copy above means that all the source (unduplicated) pointers
9501                are now in the destination.  We can check the flags and the
9502                pointers in either, but it's possible that there's less cache
9503                missing by always going for the destination.
9504                FIXME - instrument and check that assumption  */
9505             if (sv_type >= SVt_PVMG) {
9506                 if (SvMAGIC(dstr))
9507                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9508                 if (SvSTASH(dstr))
9509                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9510             }
9511
9512             /* The cast silences a GCC warning about unhandled types.  */
9513             switch ((int)sv_type) {
9514             case SVt_PV:
9515                 break;
9516             case SVt_PVIV:
9517                 break;
9518             case SVt_PVNV:
9519                 break;
9520             case SVt_PVMG:
9521                 break;
9522             case SVt_PVBM:
9523                 break;
9524             case SVt_PVLV:
9525                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9526                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9527                     LvTARG(dstr) = dstr;
9528                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9529                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9530                 else
9531                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9532                 break;
9533             case SVt_PVGV:
9534                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9535                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9536                 /* Don't call sv_add_backref here as it's going to be created
9537                    as part of the magic cloning of the symbol table.  */
9538                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9539                 (void)GpREFCNT_inc(GvGP(dstr));
9540                 break;
9541             case SVt_PVIO:
9542                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9543                 if (IoOFP(dstr) == IoIFP(sstr))
9544                     IoOFP(dstr) = IoIFP(dstr);
9545                 else
9546                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9547                 /* PL_rsfp_filters entries have fake IoDIRP() */
9548                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9549                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9550                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9551                     /* I have no idea why fake dirp (rsfps)
9552                        should be treated differently but otherwise
9553                        we end up with leaks -- sky*/
9554                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9555                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9556                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9557                 } else {
9558                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9559                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9560                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9561                 }
9562                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9563                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9564                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9565                 break;
9566             case SVt_PVAV:
9567                 if (AvARRAY((AV*)sstr)) {
9568                     SV **dst_ary, **src_ary;
9569                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9570
9571                     src_ary = AvARRAY((AV*)sstr);
9572                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9573                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9574                     SvPV_set(dstr, (char*)dst_ary);
9575                     AvALLOC((AV*)dstr) = dst_ary;
9576                     if (AvREAL((AV*)sstr)) {
9577                         while (items-- > 0)
9578                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9579                     }
9580                     else {
9581                         while (items-- > 0)
9582                             *dst_ary++ = sv_dup(*src_ary++, param);
9583                     }
9584                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9585                     while (items-- > 0) {
9586                         *dst_ary++ = &PL_sv_undef;
9587                     }
9588                 }
9589                 else {
9590                     SvPV_set(dstr, Nullch);
9591                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9592                 }
9593                 break;
9594             case SVt_PVHV:
9595                 {
9596                     HEK *hvname = NULL;
9597
9598                     if (HvARRAY((HV*)sstr)) {
9599                         STRLEN i = 0;
9600                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9601                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9602                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9603                         char *darray;
9604                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9605                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9606                             char);
9607                         HvARRAY(dstr) = (HE**)darray;
9608                         while (i <= sxhv->xhv_max) {
9609                             const HE *source = HvARRAY(sstr)[i];
9610                             HvARRAY(dstr)[i] = source
9611                                 ? he_dup(source, sharekeys, param) : 0;
9612                             ++i;
9613                         }
9614                         if (SvOOK(sstr)) {
9615                             struct xpvhv_aux * const saux = HvAUX(sstr);
9616                             struct xpvhv_aux * const daux = HvAUX(dstr);
9617                             /* This flag isn't copied.  */
9618                             /* SvOOK_on(hv) attacks the IV flags.  */
9619                             SvFLAGS(dstr) |= SVf_OOK;
9620
9621                             hvname = saux->xhv_name;
9622                             daux->xhv_name
9623                                 = hvname ? hek_dup(hvname, param) : hvname;
9624
9625                             daux->xhv_riter = saux->xhv_riter;
9626                             daux->xhv_eiter = saux->xhv_eiter
9627                                 ? he_dup(saux->xhv_eiter,
9628                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9629                             daux->xhv_backreferences = saux->xhv_backreferences
9630                                 ? (AV*) SvREFCNT_inc(
9631                                                      sv_dup((SV*)saux->
9632                                                             xhv_backreferences,
9633                                                             param))
9634                                 : 0;
9635                         }
9636                     }
9637                     else {
9638                         SvPV_set(dstr, Nullch);
9639                     }
9640                     /* Record stashes for possible cloning in Perl_clone(). */
9641                     if(hvname)
9642                         av_push(param->stashes, dstr);
9643                 }
9644                 break;
9645             case SVt_PVFM:
9646             case SVt_PVCV:
9647                 /* NOTE: not refcounted */
9648                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9649                 OP_REFCNT_LOCK;
9650                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9651                 OP_REFCNT_UNLOCK;
9652                 if (CvCONST(dstr)) {
9653                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9654                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9655                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9656                 }
9657                 /* don't dup if copying back - CvGV isn't refcounted, so the
9658                  * duped GV may never be freed. A bit of a hack! DAPM */
9659                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9660                     Nullgv : gv_dup(CvGV(dstr), param) ;
9661                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9662                     CvDEPTH(dstr) = 0;
9663                 }
9664                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9665                 CvOUTSIDE(dstr) =
9666                     CvWEAKOUTSIDE(sstr)
9667                     ? cv_dup(    CvOUTSIDE(dstr), param)
9668                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9669                 if (!CvXSUB(dstr))
9670                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9671                 break;
9672             }
9673         }
9674     }
9675
9676     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9677         ++PL_sv_objcount;
9678
9679     return dstr;
9680  }
9681
9682 /* duplicate a context */
9683
9684 PERL_CONTEXT *
9685 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9686 {
9687     PERL_CONTEXT *ncxs;
9688
9689     if (!cxs)
9690         return (PERL_CONTEXT*)NULL;
9691
9692     /* look for it in the table first */
9693     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9694     if (ncxs)
9695         return ncxs;
9696
9697     /* create anew and remember what it is */
9698     Newxz(ncxs, max + 1, PERL_CONTEXT);
9699     ptr_table_store(PL_ptr_table, cxs, ncxs);
9700
9701     while (ix >= 0) {
9702         PERL_CONTEXT * const cx = &cxs[ix];
9703         PERL_CONTEXT * const ncx = &ncxs[ix];
9704         ncx->cx_type    = cx->cx_type;
9705         if (CxTYPE(cx) == CXt_SUBST) {
9706             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9707         }
9708         else {
9709             ncx->blk_oldsp      = cx->blk_oldsp;
9710             ncx->blk_oldcop     = cx->blk_oldcop;
9711             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9712             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9713             ncx->blk_oldpm      = cx->blk_oldpm;
9714             ncx->blk_gimme      = cx->blk_gimme;
9715             switch (CxTYPE(cx)) {
9716             case CXt_SUB:
9717                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9718                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9719                                            : cv_dup(cx->blk_sub.cv,param));
9720                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9721                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9722                                            : NULL);
9723                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9724                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9725                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9726                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9727                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9728                 break;
9729             case CXt_EVAL:
9730                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9731                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9732                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9733                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9734                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9735                 ncx->blk_eval.retop = cx->blk_eval.retop;
9736                 break;
9737             case CXt_LOOP:
9738                 ncx->blk_loop.label     = cx->blk_loop.label;
9739                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9740                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9741                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9742                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9743                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9744                                            ? cx->blk_loop.iterdata
9745                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9746                 ncx->blk_loop.oldcomppad
9747                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9748                                             cx->blk_loop.oldcomppad);
9749                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9750                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9751                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9752                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9753                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9754                 break;
9755             case CXt_FORMAT:
9756                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9757                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9758                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9759                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9760                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9761                 break;
9762             case CXt_BLOCK:
9763             case CXt_NULL:
9764                 break;
9765             }
9766         }
9767         --ix;
9768     }
9769     return ncxs;
9770 }
9771
9772 /* duplicate a stack info structure */
9773
9774 PERL_SI *
9775 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9776 {
9777     PERL_SI *nsi;
9778
9779     if (!si)
9780         return (PERL_SI*)NULL;
9781
9782     /* look for it in the table first */
9783     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9784     if (nsi)
9785         return nsi;
9786
9787     /* create anew and remember what it is */
9788     Newxz(nsi, 1, PERL_SI);
9789     ptr_table_store(PL_ptr_table, si, nsi);
9790
9791     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9792     nsi->si_cxix        = si->si_cxix;
9793     nsi->si_cxmax       = si->si_cxmax;
9794     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9795     nsi->si_type        = si->si_type;
9796     nsi->si_prev        = si_dup(si->si_prev, param);
9797     nsi->si_next        = si_dup(si->si_next, param);
9798     nsi->si_markoff     = si->si_markoff;
9799
9800     return nsi;
9801 }
9802
9803 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9804 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9805 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9806 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9807 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9808 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9809 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9810 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9811 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9812 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9813 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9814 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9815 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9816 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9817
9818 /* XXXXX todo */
9819 #define pv_dup_inc(p)   SAVEPV(p)
9820 #define pv_dup(p)       SAVEPV(p)
9821 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9822
9823 /* map any object to the new equivent - either something in the
9824  * ptr table, or something in the interpreter structure
9825  */
9826
9827 void *
9828 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9829 {
9830     void *ret;
9831
9832     if (!v)
9833         return (void*)NULL;
9834
9835     /* look for it in the table first */
9836     ret = ptr_table_fetch(PL_ptr_table, v);
9837     if (ret)
9838         return ret;
9839
9840     /* see if it is part of the interpreter structure */
9841     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9842         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9843     else {
9844         ret = v;
9845     }
9846
9847     return ret;
9848 }
9849
9850 /* duplicate the save stack */
9851
9852 ANY *
9853 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9854 {
9855     ANY * const ss      = proto_perl->Tsavestack;
9856     const I32 max       = proto_perl->Tsavestack_max;
9857     I32 ix              = proto_perl->Tsavestack_ix;
9858     ANY *nss;
9859     SV *sv;
9860     GV *gv;
9861     AV *av;
9862     HV *hv;
9863     void* ptr;
9864     int intval;
9865     long longval;
9866     GP *gp;
9867     IV iv;
9868     char *c = NULL;
9869     void (*dptr) (void*);
9870     void (*dxptr) (pTHX_ void*);
9871
9872     Newxz(nss, max, ANY);
9873
9874     while (ix > 0) {
9875         I32 i = POPINT(ss,ix);
9876         TOPINT(nss,ix) = i;
9877         switch (i) {
9878         case SAVEt_ITEM:                        /* normal string */
9879             sv = (SV*)POPPTR(ss,ix);
9880             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9881             sv = (SV*)POPPTR(ss,ix);
9882             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9883             break;
9884         case SAVEt_SV:                          /* scalar reference */
9885             sv = (SV*)POPPTR(ss,ix);
9886             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9887             gv = (GV*)POPPTR(ss,ix);
9888             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9889             break;
9890         case SAVEt_GENERIC_PVREF:               /* generic char* */
9891             c = (char*)POPPTR(ss,ix);
9892             TOPPTR(nss,ix) = pv_dup(c);
9893             ptr = POPPTR(ss,ix);
9894             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9895             break;
9896         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9897             c = (char*)POPPTR(ss,ix);
9898             TOPPTR(nss,ix) = savesharedpv(c);
9899             ptr = POPPTR(ss,ix);
9900             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9901             break;
9902         case SAVEt_GENERIC_SVREF:               /* generic sv */
9903         case SAVEt_SVREF:                       /* scalar reference */
9904             sv = (SV*)POPPTR(ss,ix);
9905             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9906             ptr = POPPTR(ss,ix);
9907             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9908             break;
9909         case SAVEt_AV:                          /* array reference */
9910             av = (AV*)POPPTR(ss,ix);
9911             TOPPTR(nss,ix) = av_dup_inc(av, param);
9912             gv = (GV*)POPPTR(ss,ix);
9913             TOPPTR(nss,ix) = gv_dup(gv, param);
9914             break;
9915         case SAVEt_HV:                          /* hash reference */
9916             hv = (HV*)POPPTR(ss,ix);
9917             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9918             gv = (GV*)POPPTR(ss,ix);
9919             TOPPTR(nss,ix) = gv_dup(gv, param);
9920             break;
9921         case SAVEt_INT:                         /* int reference */
9922             ptr = POPPTR(ss,ix);
9923             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9924             intval = (int)POPINT(ss,ix);
9925             TOPINT(nss,ix) = intval;
9926             break;
9927         case SAVEt_LONG:                        /* long reference */
9928             ptr = POPPTR(ss,ix);
9929             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9930             longval = (long)POPLONG(ss,ix);
9931             TOPLONG(nss,ix) = longval;
9932             break;
9933         case SAVEt_I32:                         /* I32 reference */
9934         case SAVEt_I16:                         /* I16 reference */
9935         case SAVEt_I8:                          /* I8 reference */
9936             ptr = POPPTR(ss,ix);
9937             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9938             i = POPINT(ss,ix);
9939             TOPINT(nss,ix) = i;
9940             break;
9941         case SAVEt_IV:                          /* IV reference */
9942             ptr = POPPTR(ss,ix);
9943             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9944             iv = POPIV(ss,ix);
9945             TOPIV(nss,ix) = iv;
9946             break;
9947         case SAVEt_SPTR:                        /* SV* reference */
9948             ptr = POPPTR(ss,ix);
9949             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9950             sv = (SV*)POPPTR(ss,ix);
9951             TOPPTR(nss,ix) = sv_dup(sv, param);
9952             break;
9953         case SAVEt_VPTR:                        /* random* reference */
9954             ptr = POPPTR(ss,ix);
9955             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9956             ptr = POPPTR(ss,ix);
9957             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9958             break;
9959         case SAVEt_PPTR:                        /* char* reference */
9960             ptr = POPPTR(ss,ix);
9961             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9962             c = (char*)POPPTR(ss,ix);
9963             TOPPTR(nss,ix) = pv_dup(c);
9964             break;
9965         case SAVEt_HPTR:                        /* HV* reference */
9966             ptr = POPPTR(ss,ix);
9967             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9968             hv = (HV*)POPPTR(ss,ix);
9969             TOPPTR(nss,ix) = hv_dup(hv, param);
9970             break;
9971         case SAVEt_APTR:                        /* AV* reference */
9972             ptr = POPPTR(ss,ix);
9973             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9974             av = (AV*)POPPTR(ss,ix);
9975             TOPPTR(nss,ix) = av_dup(av, param);
9976             break;
9977         case SAVEt_NSTAB:
9978             gv = (GV*)POPPTR(ss,ix);
9979             TOPPTR(nss,ix) = gv_dup(gv, param);
9980             break;
9981         case SAVEt_GP:                          /* scalar reference */
9982             gp = (GP*)POPPTR(ss,ix);
9983             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
9984             (void)GpREFCNT_inc(gp);
9985             gv = (GV*)POPPTR(ss,ix);
9986             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9987             c = (char*)POPPTR(ss,ix);
9988             TOPPTR(nss,ix) = pv_dup(c);
9989             iv = POPIV(ss,ix);
9990             TOPIV(nss,ix) = iv;
9991             iv = POPIV(ss,ix);
9992             TOPIV(nss,ix) = iv;
9993             break;
9994         case SAVEt_FREESV:
9995         case SAVEt_MORTALIZESV:
9996             sv = (SV*)POPPTR(ss,ix);
9997             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9998             break;
9999         case SAVEt_FREEOP:
10000             ptr = POPPTR(ss,ix);
10001             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
10002                 /* these are assumed to be refcounted properly */
10003                 OP *o;
10004                 switch (((OP*)ptr)->op_type) {
10005                 case OP_LEAVESUB:
10006                 case OP_LEAVESUBLV:
10007                 case OP_LEAVEEVAL:
10008                 case OP_LEAVE:
10009                 case OP_SCOPE:
10010                 case OP_LEAVEWRITE:
10011                     TOPPTR(nss,ix) = ptr;
10012                     o = (OP*)ptr;
10013                     OpREFCNT_inc(o);
10014                     break;
10015                 default:
10016                     TOPPTR(nss,ix) = Nullop;
10017                     break;
10018                 }
10019             }
10020             else
10021                 TOPPTR(nss,ix) = Nullop;
10022             break;
10023         case SAVEt_FREEPV:
10024             c = (char*)POPPTR(ss,ix);
10025             TOPPTR(nss,ix) = pv_dup_inc(c);
10026             break;
10027         case SAVEt_CLEARSV:
10028             longval = POPLONG(ss,ix);
10029             TOPLONG(nss,ix) = longval;
10030             break;
10031         case SAVEt_DELETE:
10032             hv = (HV*)POPPTR(ss,ix);
10033             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10034             c = (char*)POPPTR(ss,ix);
10035             TOPPTR(nss,ix) = pv_dup_inc(c);
10036             i = POPINT(ss,ix);
10037             TOPINT(nss,ix) = i;
10038             break;
10039         case SAVEt_DESTRUCTOR:
10040             ptr = POPPTR(ss,ix);
10041             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10042             dptr = POPDPTR(ss,ix);
10043             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
10044                                         any_dup(FPTR2DPTR(void *, dptr),
10045                                                 proto_perl));
10046             break;
10047         case SAVEt_DESTRUCTOR_X:
10048             ptr = POPPTR(ss,ix);
10049             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10050             dxptr = POPDXPTR(ss,ix);
10051             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
10052                                          any_dup(FPTR2DPTR(void *, dxptr),
10053                                                  proto_perl));
10054             break;
10055         case SAVEt_REGCONTEXT:
10056         case SAVEt_ALLOC:
10057             i = POPINT(ss,ix);
10058             TOPINT(nss,ix) = i;
10059             ix -= i;
10060             break;
10061         case SAVEt_STACK_POS:           /* Position on Perl stack */
10062             i = POPINT(ss,ix);
10063             TOPINT(nss,ix) = i;
10064             break;
10065         case SAVEt_AELEM:               /* array element */
10066             sv = (SV*)POPPTR(ss,ix);
10067             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10068             i = POPINT(ss,ix);
10069             TOPINT(nss,ix) = i;
10070             av = (AV*)POPPTR(ss,ix);
10071             TOPPTR(nss,ix) = av_dup_inc(av, param);
10072             break;
10073         case SAVEt_HELEM:               /* hash element */
10074             sv = (SV*)POPPTR(ss,ix);
10075             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10076             sv = (SV*)POPPTR(ss,ix);
10077             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10078             hv = (HV*)POPPTR(ss,ix);
10079             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10080             break;
10081         case SAVEt_OP:
10082             ptr = POPPTR(ss,ix);
10083             TOPPTR(nss,ix) = ptr;
10084             break;
10085         case SAVEt_HINTS:
10086             i = POPINT(ss,ix);
10087             TOPINT(nss,ix) = i;
10088             break;
10089         case SAVEt_COMPPAD:
10090             av = (AV*)POPPTR(ss,ix);
10091             TOPPTR(nss,ix) = av_dup(av, param);
10092             break;
10093         case SAVEt_PADSV:
10094             longval = (long)POPLONG(ss,ix);
10095             TOPLONG(nss,ix) = longval;
10096             ptr = POPPTR(ss,ix);
10097             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10098             sv = (SV*)POPPTR(ss,ix);
10099             TOPPTR(nss,ix) = sv_dup(sv, param);
10100             break;
10101         case SAVEt_BOOL:
10102             ptr = POPPTR(ss,ix);
10103             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10104             longval = (long)POPBOOL(ss,ix);
10105             TOPBOOL(nss,ix) = (bool)longval;
10106             break;
10107         case SAVEt_SET_SVFLAGS:
10108             i = POPINT(ss,ix);
10109             TOPINT(nss,ix) = i;
10110             i = POPINT(ss,ix);
10111             TOPINT(nss,ix) = i;
10112             sv = (SV*)POPPTR(ss,ix);
10113             TOPPTR(nss,ix) = sv_dup(sv, param);
10114             break;
10115         default:
10116             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
10117         }
10118     }
10119
10120     return nss;
10121 }
10122
10123
10124 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
10125  * flag to the result. This is done for each stash before cloning starts,
10126  * so we know which stashes want their objects cloned */
10127
10128 static void
10129 do_mark_cloneable_stash(pTHX_ SV *sv)
10130 {
10131     const HEK * const hvname = HvNAME_HEK((HV*)sv);
10132     if (hvname) {
10133         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
10134         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
10135         if (cloner && GvCV(cloner)) {
10136             dSP;
10137             UV status;
10138
10139             ENTER;
10140             SAVETMPS;
10141             PUSHMARK(SP);
10142             XPUSHs(sv_2mortal(newSVhek(hvname)));
10143             PUTBACK;
10144             call_sv((SV*)GvCV(cloner), G_SCALAR);
10145             SPAGAIN;
10146             status = POPu;
10147             PUTBACK;
10148             FREETMPS;
10149             LEAVE;
10150             if (status)
10151                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
10152         }
10153     }
10154 }
10155
10156
10157
10158 /*
10159 =for apidoc perl_clone
10160
10161 Create and return a new interpreter by cloning the current one.
10162
10163 perl_clone takes these flags as parameters:
10164
10165 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10166 without it we only clone the data and zero the stacks,
10167 with it we copy the stacks and the new perl interpreter is
10168 ready to run at the exact same point as the previous one.
10169 The pseudo-fork code uses COPY_STACKS while the
10170 threads->new doesn't.
10171
10172 CLONEf_KEEP_PTR_TABLE
10173 perl_clone keeps a ptr_table with the pointer of the old
10174 variable as a key and the new variable as a value,
10175 this allows it to check if something has been cloned and not
10176 clone it again but rather just use the value and increase the
10177 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10178 the ptr_table using the function
10179 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10180 reason to keep it around is if you want to dup some of your own
10181 variable who are outside the graph perl scans, example of this
10182 code is in threads.xs create
10183
10184 CLONEf_CLONE_HOST
10185 This is a win32 thing, it is ignored on unix, it tells perls
10186 win32host code (which is c++) to clone itself, this is needed on
10187 win32 if you want to run two threads at the same time,
10188 if you just want to do some stuff in a separate perl interpreter
10189 and then throw it away and return to the original one,
10190 you don't need to do anything.
10191
10192 =cut
10193 */
10194
10195 /* XXX the above needs expanding by someone who actually understands it ! */
10196 EXTERN_C PerlInterpreter *
10197 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10198
10199 PerlInterpreter *
10200 perl_clone(PerlInterpreter *proto_perl, UV flags)
10201 {
10202    dVAR;
10203 #ifdef PERL_IMPLICIT_SYS
10204
10205    /* perlhost.h so we need to call into it
10206    to clone the host, CPerlHost should have a c interface, sky */
10207
10208    if (flags & CLONEf_CLONE_HOST) {
10209        return perl_clone_host(proto_perl,flags);
10210    }
10211    return perl_clone_using(proto_perl, flags,
10212                             proto_perl->IMem,
10213                             proto_perl->IMemShared,
10214                             proto_perl->IMemParse,
10215                             proto_perl->IEnv,
10216                             proto_perl->IStdIO,
10217                             proto_perl->ILIO,
10218                             proto_perl->IDir,
10219                             proto_perl->ISock,
10220                             proto_perl->IProc);
10221 }
10222
10223 PerlInterpreter *
10224 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10225                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10226                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10227                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10228                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10229                  struct IPerlProc* ipP)
10230 {
10231     /* XXX many of the string copies here can be optimized if they're
10232      * constants; they need to be allocated as common memory and just
10233      * their pointers copied. */
10234
10235     IV i;
10236     CLONE_PARAMS clone_params;
10237     CLONE_PARAMS* param = &clone_params;
10238
10239     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10240     /* for each stash, determine whether its objects should be cloned */
10241     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10242     PERL_SET_THX(my_perl);
10243
10244 #  ifdef DEBUGGING
10245     Poison(my_perl, 1, PerlInterpreter);
10246     PL_op = Nullop;
10247     PL_curcop = (COP *)Nullop;
10248     PL_markstack = 0;
10249     PL_scopestack = 0;
10250     PL_savestack = 0;
10251     PL_savestack_ix = 0;
10252     PL_savestack_max = -1;
10253     PL_sig_pending = 0;
10254     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10255 #  else /* !DEBUGGING */
10256     Zero(my_perl, 1, PerlInterpreter);
10257 #  endif        /* DEBUGGING */
10258
10259     /* host pointers */
10260     PL_Mem              = ipM;
10261     PL_MemShared        = ipMS;
10262     PL_MemParse         = ipMP;
10263     PL_Env              = ipE;
10264     PL_StdIO            = ipStd;
10265     PL_LIO              = ipLIO;
10266     PL_Dir              = ipD;
10267     PL_Sock             = ipS;
10268     PL_Proc             = ipP;
10269 #else           /* !PERL_IMPLICIT_SYS */
10270     IV i;
10271     CLONE_PARAMS clone_params;
10272     CLONE_PARAMS* param = &clone_params;
10273     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10274     /* for each stash, determine whether its objects should be cloned */
10275     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10276     PERL_SET_THX(my_perl);
10277
10278 #    ifdef DEBUGGING
10279     Poison(my_perl, 1, PerlInterpreter);
10280     PL_op = Nullop;
10281     PL_curcop = (COP *)Nullop;
10282     PL_markstack = 0;
10283     PL_scopestack = 0;
10284     PL_savestack = 0;
10285     PL_savestack_ix = 0;
10286     PL_savestack_max = -1;
10287     PL_sig_pending = 0;
10288     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10289 #    else       /* !DEBUGGING */
10290     Zero(my_perl, 1, PerlInterpreter);
10291 #    endif      /* DEBUGGING */
10292 #endif          /* PERL_IMPLICIT_SYS */
10293     param->flags = flags;
10294     param->proto_perl = proto_perl;
10295
10296     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10297     Zero(&PL_body_roots, 1, PL_body_roots);
10298     
10299     PL_nice_chunk       = NULL;
10300     PL_nice_chunk_size  = 0;
10301     PL_sv_count         = 0;
10302     PL_sv_objcount      = 0;
10303     PL_sv_root          = Nullsv;
10304     PL_sv_arenaroot     = Nullsv;
10305
10306     PL_debug            = proto_perl->Idebug;
10307
10308     PL_hash_seed        = proto_perl->Ihash_seed;
10309     PL_rehash_seed      = proto_perl->Irehash_seed;
10310
10311 #ifdef USE_REENTRANT_API
10312     /* XXX: things like -Dm will segfault here in perlio, but doing
10313      *  PERL_SET_CONTEXT(proto_perl);
10314      * breaks too many other things
10315      */
10316     Perl_reentrant_init(aTHX);
10317 #endif
10318
10319     /* create SV map for pointer relocation */
10320     PL_ptr_table = ptr_table_new();
10321
10322     /* initialize these special pointers as early as possible */
10323     SvANY(&PL_sv_undef)         = NULL;
10324     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10325     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10326     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10327
10328     SvANY(&PL_sv_no)            = new_XPVNV();
10329     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10330     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10331                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10332     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10333     SvCUR_set(&PL_sv_no, 0);
10334     SvLEN_set(&PL_sv_no, 1);
10335     SvIV_set(&PL_sv_no, 0);
10336     SvNV_set(&PL_sv_no, 0);
10337     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10338
10339     SvANY(&PL_sv_yes)           = new_XPVNV();
10340     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10341     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10342                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10343     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10344     SvCUR_set(&PL_sv_yes, 1);
10345     SvLEN_set(&PL_sv_yes, 2);
10346     SvIV_set(&PL_sv_yes, 1);
10347     SvNV_set(&PL_sv_yes, 1);
10348     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10349
10350     /* create (a non-shared!) shared string table */
10351     PL_strtab           = newHV();
10352     HvSHAREKEYS_off(PL_strtab);
10353     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10354     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10355
10356     PL_compiling = proto_perl->Icompiling;
10357
10358     /* These two PVs will be free'd special way so must set them same way op.c does */
10359     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10360     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10361
10362     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10363     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10364
10365     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10366     if (!specialWARN(PL_compiling.cop_warnings))
10367         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10368     if (!specialCopIO(PL_compiling.cop_io))
10369         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10370     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10371
10372     /* pseudo environmental stuff */
10373     PL_origargc         = proto_perl->Iorigargc;
10374     PL_origargv         = proto_perl->Iorigargv;
10375
10376     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10377
10378     /* Set tainting stuff before PerlIO_debug can possibly get called */
10379     PL_tainting         = proto_perl->Itainting;
10380     PL_taint_warn       = proto_perl->Itaint_warn;
10381
10382 #ifdef PERLIO_LAYERS
10383     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10384     PerlIO_clone(aTHX_ proto_perl, param);
10385 #endif
10386
10387     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10388     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10389     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10390     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10391     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10392     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10393
10394     /* switches */
10395     PL_minus_c          = proto_perl->Iminus_c;
10396     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10397     PL_localpatches     = proto_perl->Ilocalpatches;
10398     PL_splitstr         = proto_perl->Isplitstr;
10399     PL_preprocess       = proto_perl->Ipreprocess;
10400     PL_minus_n          = proto_perl->Iminus_n;
10401     PL_minus_p          = proto_perl->Iminus_p;
10402     PL_minus_l          = proto_perl->Iminus_l;
10403     PL_minus_a          = proto_perl->Iminus_a;
10404     PL_minus_E          = proto_perl->Iminus_E;
10405     PL_minus_F          = proto_perl->Iminus_F;
10406     PL_doswitches       = proto_perl->Idoswitches;
10407     PL_dowarn           = proto_perl->Idowarn;
10408     PL_doextract        = proto_perl->Idoextract;
10409     PL_sawampersand     = proto_perl->Isawampersand;
10410     PL_unsafe           = proto_perl->Iunsafe;
10411     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10412     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10413     PL_perldb           = proto_perl->Iperldb;
10414     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10415     PL_exit_flags       = proto_perl->Iexit_flags;
10416
10417     /* magical thingies */
10418     /* XXX time(&PL_basetime) when asked for? */
10419     PL_basetime         = proto_perl->Ibasetime;
10420     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10421
10422     PL_maxsysfd         = proto_perl->Imaxsysfd;
10423     PL_multiline        = proto_perl->Imultiline;
10424     PL_statusvalue      = proto_perl->Istatusvalue;
10425 #ifdef VMS
10426     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10427 #else
10428     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10429 #endif
10430     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10431
10432     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10433     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10434     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10435
10436     /* Clone the regex array */
10437     PL_regex_padav = newAV();
10438     {
10439         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10440         SV* const * const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10441         IV i;
10442         av_push(PL_regex_padav,
10443                 sv_dup_inc(regexen[0],param));
10444         for(i = 1; i <= len; i++) {
10445             const SV * const regex = regexen[i];
10446             SV * const sv =
10447                 SvREPADTMP(regex)
10448                     ? sv_dup_inc(regex, param)
10449                     : SvREFCNT_inc(
10450                         newSViv(PTR2IV(re_dup(
10451                                 INT2PTR(REGEXP *, SvIVX(regex)), param))))
10452                 ;
10453             av_push(PL_regex_padav, sv);
10454         }
10455     }
10456     PL_regex_pad = AvARRAY(PL_regex_padav);
10457
10458     /* shortcuts to various I/O objects */
10459     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10460     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10461     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10462     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10463     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10464     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10465
10466     /* shortcuts to regexp stuff */
10467     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10468
10469     /* shortcuts to misc objects */
10470     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10471
10472     /* shortcuts to debugging objects */
10473     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10474     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10475     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10476     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10477     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10478     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10479     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10480     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10481     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10482
10483     /* symbol tables */
10484     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10485     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10486     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10487     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10488     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10489
10490     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10491     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10492     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10493     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10494     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10495     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10496
10497     PL_sub_generation   = proto_perl->Isub_generation;
10498
10499     /* funky return mechanisms */
10500     PL_forkprocess      = proto_perl->Iforkprocess;
10501
10502     /* subprocess state */
10503     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10504
10505     /* internal state */
10506     PL_maxo             = proto_perl->Imaxo;
10507     if (proto_perl->Iop_mask)
10508         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10509     else
10510         PL_op_mask      = Nullch;
10511     /* PL_asserting        = proto_perl->Iasserting; */
10512
10513     /* current interpreter roots */
10514     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10515     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10516     PL_main_start       = proto_perl->Imain_start;
10517     PL_eval_root        = proto_perl->Ieval_root;
10518     PL_eval_start       = proto_perl->Ieval_start;
10519
10520     /* runtime control stuff */
10521     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10522     PL_copline          = proto_perl->Icopline;
10523
10524     PL_filemode         = proto_perl->Ifilemode;
10525     PL_lastfd           = proto_perl->Ilastfd;
10526     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10527     PL_Argv             = NULL;
10528     PL_Cmd              = Nullch;
10529     PL_gensym           = proto_perl->Igensym;
10530     PL_preambled        = proto_perl->Ipreambled;
10531     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10532     PL_laststatval      = proto_perl->Ilaststatval;
10533     PL_laststype        = proto_perl->Ilaststype;
10534     PL_mess_sv          = Nullsv;
10535
10536     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10537
10538     /* interpreter atexit processing */
10539     PL_exitlistlen      = proto_perl->Iexitlistlen;
10540     if (PL_exitlistlen) {
10541         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10542         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10543     }
10544     else
10545         PL_exitlist     = (PerlExitListEntry*)NULL;
10546
10547     PL_my_cxt_size = proto_perl->Imy_cxt_size;
10548     if (PL_my_cxt_size) {
10549         Newx(PL_my_cxt_list, PL_my_cxt_size, void *);
10550         Copy(proto_perl->Imy_cxt_list, PL_my_cxt_list, PL_my_cxt_size, void *);
10551     }
10552     else
10553         PL_my_cxt_list  = (void**)NULL;
10554     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10555     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10556     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10557
10558     PL_profiledata      = NULL;
10559     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10560     /* PL_rsfp_filters entries have fake IoDIRP() */
10561     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10562
10563     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10564
10565     PAD_CLONE_VARS(proto_perl, param);
10566
10567 #ifdef HAVE_INTERP_INTERN
10568     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10569 #endif
10570
10571     /* more statics moved here */
10572     PL_generation       = proto_perl->Igeneration;
10573     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10574
10575     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10576     PL_in_clean_all     = proto_perl->Iin_clean_all;
10577
10578     PL_uid              = proto_perl->Iuid;
10579     PL_euid             = proto_perl->Ieuid;
10580     PL_gid              = proto_perl->Igid;
10581     PL_egid             = proto_perl->Iegid;
10582     PL_nomemok          = proto_perl->Inomemok;
10583     PL_an               = proto_perl->Ian;
10584     PL_evalseq          = proto_perl->Ievalseq;
10585     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10586     PL_origalen         = proto_perl->Iorigalen;
10587 #ifdef PERL_USES_PL_PIDSTATUS
10588     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10589 #endif
10590     PL_osname           = SAVEPV(proto_perl->Iosname);
10591     PL_sighandlerp      = proto_perl->Isighandlerp;
10592
10593     PL_runops           = proto_perl->Irunops;
10594
10595     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10596
10597 #ifdef CSH
10598     PL_cshlen           = proto_perl->Icshlen;
10599     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10600 #endif
10601
10602     PL_lex_state        = proto_perl->Ilex_state;
10603     PL_lex_defer        = proto_perl->Ilex_defer;
10604     PL_lex_expect       = proto_perl->Ilex_expect;
10605     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10606     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10607     PL_lex_starts       = proto_perl->Ilex_starts;
10608     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10609     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10610     PL_lex_op           = proto_perl->Ilex_op;
10611     PL_lex_inpat        = proto_perl->Ilex_inpat;
10612     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10613     PL_lex_brackets     = proto_perl->Ilex_brackets;
10614     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10615     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10616     PL_lex_casemods     = proto_perl->Ilex_casemods;
10617     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10618     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10619
10620     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10621     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10622     PL_nexttoke         = proto_perl->Inexttoke;
10623
10624     /* XXX This is probably masking the deeper issue of why
10625      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10626      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10627      * (A little debugging with a watchpoint on it may help.)
10628      */
10629     if (SvANY(proto_perl->Ilinestr)) {
10630         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10631         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10632         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10633         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10634         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10635         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10636         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10637         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10638         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10639     }
10640     else {
10641         PL_linestr = NEWSV(65,79);
10642         sv_upgrade(PL_linestr,SVt_PVIV);
10643         sv_setpvn(PL_linestr,"",0);
10644         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10645     }
10646     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10647     PL_pending_ident    = proto_perl->Ipending_ident;
10648     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10649
10650     PL_expect           = proto_perl->Iexpect;
10651
10652     PL_multi_start      = proto_perl->Imulti_start;
10653     PL_multi_end        = proto_perl->Imulti_end;
10654     PL_multi_open       = proto_perl->Imulti_open;
10655     PL_multi_close      = proto_perl->Imulti_close;
10656
10657     PL_error_count      = proto_perl->Ierror_count;
10658     PL_subline          = proto_perl->Isubline;
10659     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10660
10661     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10662     if (SvANY(proto_perl->Ilinestr)) {
10663         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10664         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10665         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10666         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10667         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10668     }
10669     else {
10670         PL_last_uni     = SvPVX(PL_linestr);
10671         PL_last_lop     = SvPVX(PL_linestr);
10672         PL_last_lop_op  = 0;
10673     }
10674     PL_in_my            = proto_perl->Iin_my;
10675     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10676 #ifdef FCRYPT
10677     PL_cryptseen        = proto_perl->Icryptseen;
10678 #endif
10679
10680     PL_hints            = proto_perl->Ihints;
10681
10682     PL_amagic_generation        = proto_perl->Iamagic_generation;
10683
10684 #ifdef USE_LOCALE_COLLATE
10685     PL_collation_ix     = proto_perl->Icollation_ix;
10686     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10687     PL_collation_standard       = proto_perl->Icollation_standard;
10688     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10689     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10690 #endif /* USE_LOCALE_COLLATE */
10691
10692 #ifdef USE_LOCALE_NUMERIC
10693     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10694     PL_numeric_standard = proto_perl->Inumeric_standard;
10695     PL_numeric_local    = proto_perl->Inumeric_local;
10696     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10697 #endif /* !USE_LOCALE_NUMERIC */
10698
10699     /* utf8 character classes */
10700     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10701     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10702     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10703     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10704     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10705     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10706     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10707     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10708     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10709     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10710     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10711     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10712     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10713     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10714     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10715     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10716     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10717     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10718     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10719     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10720
10721     /* Did the locale setup indicate UTF-8? */
10722     PL_utf8locale       = proto_perl->Iutf8locale;
10723     /* Unicode features (see perlrun/-C) */
10724     PL_unicode          = proto_perl->Iunicode;
10725
10726     /* Pre-5.8 signals control */
10727     PL_signals          = proto_perl->Isignals;
10728
10729     /* times() ticks per second */
10730     PL_clocktick        = proto_perl->Iclocktick;
10731
10732     /* Recursion stopper for PerlIO_find_layer */
10733     PL_in_load_module   = proto_perl->Iin_load_module;
10734
10735     /* sort() routine */
10736     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10737
10738     /* Not really needed/useful since the reenrant_retint is "volatile",
10739      * but do it for consistency's sake. */
10740     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10741
10742     /* Hooks to shared SVs and locks. */
10743     PL_sharehook        = proto_perl->Isharehook;
10744     PL_lockhook         = proto_perl->Ilockhook;
10745     PL_unlockhook       = proto_perl->Iunlockhook;
10746     PL_threadhook       = proto_perl->Ithreadhook;
10747
10748     PL_runops_std       = proto_perl->Irunops_std;
10749     PL_runops_dbg       = proto_perl->Irunops_dbg;
10750
10751 #ifdef THREADS_HAVE_PIDS
10752     PL_ppid             = proto_perl->Ippid;
10753 #endif
10754
10755     /* swatch cache */
10756     PL_last_swash_hv    = NULL; /* reinits on demand */
10757     PL_last_swash_klen  = 0;
10758     PL_last_swash_key[0]= '\0';
10759     PL_last_swash_tmps  = (U8*)NULL;
10760     PL_last_swash_slen  = 0;
10761
10762     PL_glob_index       = proto_perl->Iglob_index;
10763     PL_srand_called     = proto_perl->Isrand_called;
10764     PL_uudmap['M']      = 0;            /* reinits on demand */
10765     PL_bitcount         = Nullch;       /* reinits on demand */
10766
10767     if (proto_perl->Ipsig_pend) {
10768         Newxz(PL_psig_pend, SIG_SIZE, int);
10769     }
10770     else {
10771         PL_psig_pend    = (int*)NULL;
10772     }
10773
10774     if (proto_perl->Ipsig_ptr) {
10775         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10776         Newxz(PL_psig_name, SIG_SIZE, SV*);
10777         for (i = 1; i < SIG_SIZE; i++) {
10778             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10779             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10780         }
10781     }
10782     else {
10783         PL_psig_ptr     = (SV**)NULL;
10784         PL_psig_name    = (SV**)NULL;
10785     }
10786
10787     /* thrdvar.h stuff */
10788
10789     if (flags & CLONEf_COPY_STACKS) {
10790         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10791         PL_tmps_ix              = proto_perl->Ttmps_ix;
10792         PL_tmps_max             = proto_perl->Ttmps_max;
10793         PL_tmps_floor           = proto_perl->Ttmps_floor;
10794         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10795         i = 0;
10796         while (i <= PL_tmps_ix) {
10797             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10798             ++i;
10799         }
10800
10801         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10802         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10803         Newxz(PL_markstack, i, I32);
10804         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10805                                                   - proto_perl->Tmarkstack);
10806         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10807                                                   - proto_perl->Tmarkstack);
10808         Copy(proto_perl->Tmarkstack, PL_markstack,
10809              PL_markstack_ptr - PL_markstack + 1, I32);
10810
10811         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10812          * NOTE: unlike the others! */
10813         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10814         PL_scopestack_max       = proto_perl->Tscopestack_max;
10815         Newxz(PL_scopestack, PL_scopestack_max, I32);
10816         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10817
10818         /* NOTE: si_dup() looks at PL_markstack */
10819         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10820
10821         /* PL_curstack          = PL_curstackinfo->si_stack; */
10822         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10823         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10824
10825         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10826         PL_stack_base           = AvARRAY(PL_curstack);
10827         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10828                                                    - proto_perl->Tstack_base);
10829         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10830
10831         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10832          * NOTE: unlike the others! */
10833         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10834         PL_savestack_max        = proto_perl->Tsavestack_max;
10835         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10836         PL_savestack            = ss_dup(proto_perl, param);
10837     }
10838     else {
10839         init_stacks();
10840         ENTER;                  /* perl_destruct() wants to LEAVE; */
10841
10842         /* although we're not duplicating the tmps stack, we should still
10843          * add entries for any SVs on the tmps stack that got cloned by a
10844          * non-refcount means (eg a temp in @_); otherwise they will be
10845          * orphaned
10846          */
10847         for (i = 0; i<= proto_perl->Ttmps_ix; i++) {
10848             SV *nsv = (SV*)ptr_table_fetch(PL_ptr_table,
10849                     proto_perl->Ttmps_stack[i]);
10850             if (nsv && !SvREFCNT(nsv)) {
10851                 EXTEND_MORTAL(1);
10852                 PL_tmps_stack[++PL_tmps_ix] = SvREFCNT_inc(nsv);
10853             }
10854         }
10855     }
10856
10857     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10858     PL_top_env          = &PL_start_env;
10859
10860     PL_op               = proto_perl->Top;
10861
10862     PL_Sv               = Nullsv;
10863     PL_Xpv              = (XPV*)NULL;
10864     PL_na               = proto_perl->Tna;
10865
10866     PL_statbuf          = proto_perl->Tstatbuf;
10867     PL_statcache        = proto_perl->Tstatcache;
10868     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10869     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10870 #ifdef HAS_TIMES
10871     PL_timesbuf         = proto_perl->Ttimesbuf;
10872 #endif
10873
10874     PL_tainted          = proto_perl->Ttainted;
10875     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10876     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10877     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10878     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10879     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10880     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10881     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10882     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10883     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10884
10885     PL_restartop        = proto_perl->Trestartop;
10886     PL_in_eval          = proto_perl->Tin_eval;
10887     PL_delaymagic       = proto_perl->Tdelaymagic;
10888     PL_dirty            = proto_perl->Tdirty;
10889     PL_localizing       = proto_perl->Tlocalizing;
10890
10891     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10892     PL_hv_fetch_ent_mh  = Nullhe;
10893     PL_modcount         = proto_perl->Tmodcount;
10894     PL_lastgotoprobe    = Nullop;
10895     PL_dumpindent       = proto_perl->Tdumpindent;
10896
10897     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10898     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10899     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10900     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10901     PL_efloatbuf        = Nullch;               /* reinits on demand */
10902     PL_efloatsize       = 0;                    /* reinits on demand */
10903
10904     /* regex stuff */
10905
10906     PL_screamfirst      = NULL;
10907     PL_screamnext       = NULL;
10908     PL_maxscream        = -1;                   /* reinits on demand */
10909     PL_lastscream       = Nullsv;
10910
10911     PL_watchaddr        = NULL;
10912     PL_watchok          = Nullch;
10913
10914     PL_regdummy         = proto_perl->Tregdummy;
10915     PL_regprecomp       = Nullch;
10916     PL_regnpar          = 0;
10917     PL_regsize          = 0;
10918     PL_colorset         = 0;            /* reinits PL_colors[] */
10919     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10920     PL_reginput         = Nullch;
10921     PL_regbol           = Nullch;
10922     PL_regeol           = Nullch;
10923     PL_regstartp        = (I32*)NULL;
10924     PL_regendp          = (I32*)NULL;
10925     PL_reglastparen     = (U32*)NULL;
10926     PL_reglastcloseparen        = (U32*)NULL;
10927     PL_regtill          = Nullch;
10928     PL_reg_start_tmp    = (char**)NULL;
10929     PL_reg_start_tmpl   = 0;
10930     PL_regdata          = (struct reg_data*)NULL;
10931     PL_bostr            = Nullch;
10932     PL_reg_flags        = 0;
10933     PL_reg_eval_set     = 0;
10934     PL_regnarrate       = 0;
10935     PL_regprogram       = (regnode*)NULL;
10936     PL_regindent        = 0;
10937     PL_regcc            = (CURCUR*)NULL;
10938     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10939     PL_reg_re           = (regexp*)NULL;
10940     PL_reg_ganch        = Nullch;
10941     PL_reg_sv           = Nullsv;
10942     PL_reg_match_utf8   = FALSE;
10943     PL_reg_magic        = (MAGIC*)NULL;
10944     PL_reg_oldpos       = 0;
10945     PL_reg_oldcurpm     = (PMOP*)NULL;
10946     PL_reg_curpm        = (PMOP*)NULL;
10947     PL_reg_oldsaved     = Nullch;
10948     PL_reg_oldsavedlen  = 0;
10949 #ifdef PERL_OLD_COPY_ON_WRITE
10950     PL_nrs              = Nullsv;
10951 #endif
10952     PL_reg_maxiter      = 0;
10953     PL_reg_leftiter     = 0;
10954     PL_reg_poscache     = Nullch;
10955     PL_reg_poscache_size= 0;
10956
10957     /* RE engine - function pointers */
10958     PL_regcompp         = proto_perl->Tregcompp;
10959     PL_regexecp         = proto_perl->Tregexecp;
10960     PL_regint_start     = proto_perl->Tregint_start;
10961     PL_regint_string    = proto_perl->Tregint_string;
10962     PL_regfree          = proto_perl->Tregfree;
10963
10964     PL_reginterp_cnt    = 0;
10965     PL_reg_starttry     = 0;
10966
10967     /* Pluggable optimizer */
10968     PL_peepp            = proto_perl->Tpeepp;
10969
10970     PL_stashcache       = newHV();
10971
10972     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
10973         ptr_table_free(PL_ptr_table);
10974         PL_ptr_table = NULL;
10975     }
10976
10977     /* Call the ->CLONE method, if it exists, for each of the stashes
10978        identified by sv_dup() above.
10979     */
10980     while(av_len(param->stashes) != -1) {
10981         HV* const stash = (HV*) av_shift(param->stashes);
10982         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
10983         if (cloner && GvCV(cloner)) {
10984             dSP;
10985             ENTER;
10986             SAVETMPS;
10987             PUSHMARK(SP);
10988             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
10989             PUTBACK;
10990             call_sv((SV*)GvCV(cloner), G_DISCARD);
10991             FREETMPS;
10992             LEAVE;
10993         }
10994     }
10995
10996     SvREFCNT_dec(param->stashes);
10997
10998     /* orphaned? eg threads->new inside BEGIN or use */
10999     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
11000         (void)SvREFCNT_inc(PL_compcv);
11001         SAVEFREESV(PL_compcv);
11002     }
11003
11004     return my_perl;
11005 }
11006
11007 #endif /* USE_ITHREADS */
11008
11009 /*
11010 =head1 Unicode Support
11011
11012 =for apidoc sv_recode_to_utf8
11013
11014 The encoding is assumed to be an Encode object, on entry the PV
11015 of the sv is assumed to be octets in that encoding, and the sv
11016 will be converted into Unicode (and UTF-8).
11017
11018 If the sv already is UTF-8 (or if it is not POK), or if the encoding
11019 is not a reference, nothing is done to the sv.  If the encoding is not
11020 an C<Encode::XS> Encoding object, bad things will happen.
11021 (See F<lib/encoding.pm> and L<Encode>).
11022
11023 The PV of the sv is returned.
11024
11025 =cut */
11026
11027 char *
11028 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
11029 {
11030     dVAR;
11031     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
11032         SV *uni;
11033         STRLEN len;
11034         const char *s;
11035         dSP;
11036         ENTER;
11037         SAVETMPS;
11038         save_re_context();
11039         PUSHMARK(sp);
11040         EXTEND(SP, 3);
11041         XPUSHs(encoding);
11042         XPUSHs(sv);
11043 /*
11044   NI-S 2002/07/09
11045   Passing sv_yes is wrong - it needs to be or'ed set of constants
11046   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
11047   remove converted chars from source.
11048
11049   Both will default the value - let them.
11050
11051         XPUSHs(&PL_sv_yes);
11052 */
11053         PUTBACK;
11054         call_method("decode", G_SCALAR);
11055         SPAGAIN;
11056         uni = POPs;
11057         PUTBACK;
11058         s = SvPV_const(uni, len);
11059         if (s != SvPVX_const(sv)) {
11060             SvGROW(sv, len + 1);
11061             Move(s, SvPVX(sv), len + 1, char);
11062             SvCUR_set(sv, len);
11063         }
11064         FREETMPS;
11065         LEAVE;
11066         SvUTF8_on(sv);
11067         return SvPVX(sv);
11068     }
11069     return SvPOKp(sv) ? SvPVX(sv) : NULL;
11070 }
11071
11072 /*
11073 =for apidoc sv_cat_decode
11074
11075 The encoding is assumed to be an Encode object, the PV of the ssv is
11076 assumed to be octets in that encoding and decoding the input starts
11077 from the position which (PV + *offset) pointed to.  The dsv will be
11078 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
11079 when the string tstr appears in decoding output or the input ends on
11080 the PV of the ssv. The value which the offset points will be modified
11081 to the last input position on the ssv.
11082
11083 Returns TRUE if the terminator was found, else returns FALSE.
11084
11085 =cut */
11086
11087 bool
11088 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
11089                    SV *ssv, int *offset, char *tstr, int tlen)
11090 {
11091     dVAR;
11092     bool ret = FALSE;
11093     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
11094         SV *offsv;
11095         dSP;
11096         ENTER;
11097         SAVETMPS;
11098         save_re_context();
11099         PUSHMARK(sp);
11100         EXTEND(SP, 6);
11101         XPUSHs(encoding);
11102         XPUSHs(dsv);
11103         XPUSHs(ssv);
11104         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
11105         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
11106         PUTBACK;
11107         call_method("cat_decode", G_SCALAR);
11108         SPAGAIN;
11109         ret = SvTRUE(TOPs);
11110         *offset = SvIV(offsv);
11111         PUTBACK;
11112         FREETMPS;
11113         LEAVE;
11114     }
11115     else
11116         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
11117     return ret;
11118
11119 }
11120
11121 /* ---------------------------------------------------------------------
11122  *
11123  * support functions for report_uninit()
11124  */
11125
11126 /* the maxiumum size of array or hash where we will scan looking
11127  * for the undefined element that triggered the warning */
11128
11129 #define FUV_MAX_SEARCH_SIZE 1000
11130
11131 /* Look for an entry in the hash whose value has the same SV as val;
11132  * If so, return a mortal copy of the key. */
11133
11134 STATIC SV*
11135 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
11136 {
11137     dVAR;
11138     register HE **array;
11139     I32 i;
11140
11141     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
11142                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
11143         return Nullsv;
11144
11145     array = HvARRAY(hv);
11146
11147     for (i=HvMAX(hv); i>0; i--) {
11148         register HE *entry;
11149         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
11150             if (HeVAL(entry) != val)
11151                 continue;
11152             if (    HeVAL(entry) == &PL_sv_undef ||
11153                     HeVAL(entry) == &PL_sv_placeholder)
11154                 continue;
11155             if (!HeKEY(entry))
11156                 return Nullsv;
11157             if (HeKLEN(entry) == HEf_SVKEY)
11158                 return sv_mortalcopy(HeKEY_sv(entry));
11159             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
11160         }
11161     }
11162     return Nullsv;
11163 }
11164
11165 /* Look for an entry in the array whose value has the same SV as val;
11166  * If so, return the index, otherwise return -1. */
11167
11168 STATIC I32
11169 S_find_array_subscript(pTHX_ AV *av, SV* val)
11170 {
11171     dVAR;
11172     SV** svp;
11173     I32 i;
11174     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
11175                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
11176         return -1;
11177
11178     svp = AvARRAY(av);
11179     for (i=AvFILLp(av); i>=0; i--) {
11180         if (svp[i] == val && svp[i] != &PL_sv_undef)
11181             return i;
11182     }
11183     return -1;
11184 }
11185
11186 /* S_varname(): return the name of a variable, optionally with a subscript.
11187  * If gv is non-zero, use the name of that global, along with gvtype (one
11188  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11189  * targ.  Depending on the value of the subscript_type flag, return:
11190  */
11191
11192 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11193 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11194 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11195 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11196
11197 STATIC SV*
11198 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11199         SV* keyname, I32 aindex, int subscript_type)
11200 {
11201
11202     SV * const name = sv_newmortal();
11203     if (gv) {
11204         char buffer[2];
11205         buffer[0] = gvtype;
11206         buffer[1] = 0;
11207
11208         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11209
11210         gv_fullname4(name, gv, buffer, 0);
11211
11212         if ((unsigned int)SvPVX(name)[1] <= 26) {
11213             buffer[0] = '^';
11214             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11215
11216             /* Swap the 1 unprintable control character for the 2 byte pretty
11217                version - ie substr($name, 1, 1) = $buffer; */
11218             sv_insert(name, 1, 1, buffer, 2);
11219         }
11220     }
11221     else {
11222         U32 unused;
11223         CV * const cv = find_runcv(&unused);
11224         SV *sv;
11225         AV *av;
11226
11227         if (!cv || !CvPADLIST(cv))
11228             return Nullsv;
11229         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11230         sv = *av_fetch(av, targ, FALSE);
11231         /* SvLEN in a pad name is not to be trusted */
11232         sv_setpv(name, SvPV_nolen_const(sv));
11233     }
11234
11235     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11236         SV * const sv = NEWSV(0,0);
11237         *SvPVX(name) = '$';
11238         Perl_sv_catpvf(aTHX_ name, "{%s}",
11239             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11240         SvREFCNT_dec(sv);
11241     }
11242     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11243         *SvPVX(name) = '$';
11244         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11245     }
11246     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11247         Perl_sv_insert(aTHX_ name, 0, 0,  STR_WITH_LEN("within "));
11248
11249     return name;
11250 }
11251
11252
11253 /*
11254 =for apidoc find_uninit_var
11255
11256 Find the name of the undefined variable (if any) that caused the operator o
11257 to issue a "Use of uninitialized value" warning.
11258 If match is true, only return a name if it's value matches uninit_sv.
11259 So roughly speaking, if a unary operator (such as OP_COS) generates a
11260 warning, then following the direct child of the op may yield an
11261 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11262 other hand, with OP_ADD there are two branches to follow, so we only print
11263 the variable name if we get an exact match.
11264
11265 The name is returned as a mortal SV.
11266
11267 Assumes that PL_op is the op that originally triggered the error, and that
11268 PL_comppad/PL_curpad points to the currently executing pad.
11269
11270 =cut
11271 */
11272
11273 STATIC SV *
11274 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11275 {
11276     dVAR;
11277     SV *sv;
11278     AV *av;
11279     GV *gv;
11280     OP *o, *o2, *kid;
11281
11282     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11283                             uninit_sv == &PL_sv_placeholder)))
11284         return Nullsv;
11285
11286     switch (obase->op_type) {
11287
11288     case OP_RV2AV:
11289     case OP_RV2HV:
11290     case OP_PADAV:
11291     case OP_PADHV:
11292       {
11293         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11294         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11295         I32 index = 0;
11296         SV *keysv = Nullsv;
11297         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11298
11299         if (pad) { /* @lex, %lex */
11300             sv = PAD_SVl(obase->op_targ);
11301             gv = Nullgv;
11302         }
11303         else {
11304             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11305             /* @global, %global */
11306                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11307                 if (!gv)
11308                     break;
11309                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11310             }
11311             else /* @{expr}, %{expr} */
11312                 return find_uninit_var(cUNOPx(obase)->op_first,
11313                                                     uninit_sv, match);
11314         }
11315
11316         /* attempt to find a match within the aggregate */
11317         if (hash) {
11318             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11319             if (keysv)
11320                 subscript_type = FUV_SUBSCRIPT_HASH;
11321         }
11322         else {
11323             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11324             if (index >= 0)
11325                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11326         }
11327
11328         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11329             break;
11330
11331         return varname(gv, hash ? '%' : '@', obase->op_targ,
11332                                     keysv, index, subscript_type);
11333       }
11334
11335     case OP_PADSV:
11336         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11337             break;
11338         return varname(Nullgv, '$', obase->op_targ,
11339                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11340
11341     case OP_GVSV:
11342         gv = cGVOPx_gv(obase);
11343         if (!gv || (match && GvSV(gv) != uninit_sv))
11344             break;
11345         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11346
11347     case OP_AELEMFAST:
11348         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11349             if (match) {
11350                 SV **svp;
11351                 av = (AV*)PAD_SV(obase->op_targ);
11352                 if (!av || SvRMAGICAL(av))
11353                     break;
11354                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11355                 if (!svp || *svp != uninit_sv)
11356                     break;
11357             }
11358             return varname(Nullgv, '$', obase->op_targ,
11359                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11360         }
11361         else {
11362             gv = cGVOPx_gv(obase);
11363             if (!gv)
11364                 break;
11365             if (match) {
11366                 SV **svp;
11367                 av = GvAV(gv);
11368                 if (!av || SvRMAGICAL(av))
11369                     break;
11370                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11371                 if (!svp || *svp != uninit_sv)
11372                     break;
11373             }
11374             return varname(gv, '$', 0,
11375                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11376         }
11377         break;
11378
11379     case OP_EXISTS:
11380         o = cUNOPx(obase)->op_first;
11381         if (!o || o->op_type != OP_NULL ||
11382                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11383             break;
11384         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11385
11386     case OP_AELEM:
11387     case OP_HELEM:
11388         if (PL_op == obase)
11389             /* $a[uninit_expr] or $h{uninit_expr} */
11390             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11391
11392         gv = Nullgv;
11393         o = cBINOPx(obase)->op_first;
11394         kid = cBINOPx(obase)->op_last;
11395
11396         /* get the av or hv, and optionally the gv */
11397         sv = Nullsv;
11398         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11399             sv = PAD_SV(o->op_targ);
11400         }
11401         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11402                 && cUNOPo->op_first->op_type == OP_GV)
11403         {
11404             gv = cGVOPx_gv(cUNOPo->op_first);
11405             if (!gv)
11406                 break;
11407             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11408         }
11409         if (!sv)
11410             break;
11411
11412         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11413             /* index is constant */
11414             if (match) {
11415                 if (SvMAGICAL(sv))
11416                     break;
11417                 if (obase->op_type == OP_HELEM) {
11418                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11419                     if (!he || HeVAL(he) != uninit_sv)
11420                         break;
11421                 }
11422                 else {
11423                     SV * const * const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11424                     if (!svp || *svp != uninit_sv)
11425                         break;
11426                 }
11427             }
11428             if (obase->op_type == OP_HELEM)
11429                 return varname(gv, '%', o->op_targ,
11430                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11431             else
11432                 return varname(gv, '@', o->op_targ, Nullsv,
11433                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11434         }
11435         else  {
11436             /* index is an expression;
11437              * attempt to find a match within the aggregate */
11438             if (obase->op_type == OP_HELEM) {
11439                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11440                 if (keysv)
11441                     return varname(gv, '%', o->op_targ,
11442                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11443             }
11444             else {
11445                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11446                 if (index >= 0)
11447                     return varname(gv, '@', o->op_targ,
11448                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11449             }
11450             if (match)
11451                 break;
11452             return varname(gv,
11453                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11454                 ? '@' : '%',
11455                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11456         }
11457
11458         break;
11459
11460     case OP_AASSIGN:
11461         /* only examine RHS */
11462         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11463
11464     case OP_OPEN:
11465         o = cUNOPx(obase)->op_first;
11466         if (o->op_type == OP_PUSHMARK)
11467             o = o->op_sibling;
11468
11469         if (!o->op_sibling) {
11470             /* one-arg version of open is highly magical */
11471
11472             if (o->op_type == OP_GV) { /* open FOO; */
11473                 gv = cGVOPx_gv(o);
11474                 if (match && GvSV(gv) != uninit_sv)
11475                     break;
11476                 return varname(gv, '$', 0,
11477                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11478             }
11479             /* other possibilities not handled are:
11480              * open $x; or open my $x;  should return '${*$x}'
11481              * open expr;               should return '$'.expr ideally
11482              */
11483              break;
11484         }
11485         goto do_op;
11486
11487     /* ops where $_ may be an implicit arg */
11488     case OP_TRANS:
11489     case OP_SUBST:
11490     case OP_MATCH:
11491         if ( !(obase->op_flags & OPf_STACKED)) {
11492             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11493                                  ? PAD_SVl(obase->op_targ)
11494                                  : DEFSV))
11495             {
11496                 sv = sv_newmortal();
11497                 sv_setpvn(sv, "$_", 2);
11498                 return sv;
11499             }
11500         }
11501         goto do_op;
11502
11503     case OP_PRTF:
11504     case OP_PRINT:
11505         /* skip filehandle as it can't produce 'undef' warning  */
11506         o = cUNOPx(obase)->op_first;
11507         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11508             o = o->op_sibling->op_sibling;
11509         goto do_op2;
11510
11511
11512     case OP_RV2SV:
11513     case OP_CUSTOM:
11514     case OP_ENTERSUB:
11515         match = 1; /* XS or custom code could trigger random warnings */
11516         goto do_op;
11517
11518     case OP_SCHOMP:
11519     case OP_CHOMP:
11520         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11521             return sv_2mortal(newSVpvs("${$/}"));
11522         /* FALL THROUGH */
11523
11524     default:
11525     do_op:
11526         if (!(obase->op_flags & OPf_KIDS))
11527             break;
11528         o = cUNOPx(obase)->op_first;
11529         
11530     do_op2:
11531         if (!o)
11532             break;
11533
11534         /* if all except one arg are constant, or have no side-effects,
11535          * or are optimized away, then it's unambiguous */
11536         o2 = Nullop;
11537         for (kid=o; kid; kid = kid->op_sibling) {
11538             if (kid &&
11539                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11540                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11541                   || (kid->op_type == OP_PUSHMARK)
11542                 )
11543             )
11544                 continue;
11545             if (o2) { /* more than one found */
11546                 o2 = Nullop;
11547                 break;
11548             }
11549             o2 = kid;
11550         }
11551         if (o2)
11552             return find_uninit_var(o2, uninit_sv, match);
11553
11554         /* scan all args */
11555         while (o) {
11556             sv = find_uninit_var(o, uninit_sv, 1);
11557             if (sv)
11558                 return sv;
11559             o = o->op_sibling;
11560         }
11561         break;
11562     }
11563     return Nullsv;
11564 }
11565
11566
11567 /*
11568 =for apidoc report_uninit
11569
11570 Print appropriate "Use of uninitialized variable" warning
11571
11572 =cut
11573 */
11574
11575 void
11576 Perl_report_uninit(pTHX_ SV* uninit_sv)
11577 {
11578     dVAR;
11579     if (PL_op) {
11580         SV* varname = Nullsv;
11581         if (uninit_sv) {
11582             varname = find_uninit_var(PL_op, uninit_sv,0);
11583             if (varname)
11584                 sv_insert(varname, 0, 0, " ", 1);
11585         }
11586         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11587                 varname ? SvPV_nolen_const(varname) : "",
11588                 " in ", OP_DESC(PL_op));
11589     }
11590     else
11591         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11592                     "", "", "");
11593 }
11594
11595 /*
11596  * Local variables:
11597  * c-indentation-style: bsd
11598  * c-basic-offset: 4
11599  * indent-tabs-mode: t
11600  * End:
11601  *
11602  * ex: set ts=8 sts=4 sw=4 noet:
11603  */