ae3754f3fbe746fc49eb9d3478a6fdb1f64ad7ca
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* const sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = Nullav;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void **arena_root   = &PL_body_arenaroots[sv_type];
644     void **root         = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void **r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void **thing_copy = (void **)thing;     \
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      + relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
813      - relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      + relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
819      - relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      + relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
835      - relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      + relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
841      - relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s, *end;
1417           for (s = SvPVX_const(sv), end = s + SvCUR(sv); s < end && d < limit;
1418                s++) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 /*
1629 =for apidoc sv_2iv_flags
1630
1631 Return the integer value of an SV, doing any necessary string
1632 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1633 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1634
1635 =cut
1636 */
1637
1638 IV
1639 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1640 {
1641     if (!sv)
1642         return 0;
1643     if (SvGMAGICAL(sv)) {
1644         if (flags & SV_GMAGIC)
1645             mg_get(sv);
1646         if (SvIOKp(sv))
1647             return SvIVX(sv);
1648         if (SvNOKp(sv)) {
1649             return I_V(SvNVX(sv));
1650         }
1651         if (SvPOKp(sv) && SvLEN(sv))
1652             return asIV(sv);
1653         if (!SvROK(sv)) {
1654             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1655                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1656                     report_uninit(sv);
1657             }
1658             return 0;
1659         }
1660     }
1661     if (SvTHINKFIRST(sv)) {
1662         if (SvROK(sv)) {
1663             if (SvAMAGIC(sv)) {
1664                 SV * const tmpstr=AMG_CALLun(sv,numer);
1665                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1666                     return SvIV(tmpstr);
1667                 }
1668             }
1669             return PTR2IV(SvRV(sv));
1670         }
1671         if (SvIsCOW(sv)) {
1672             sv_force_normal_flags(sv, 0);
1673         }
1674         if (SvREADONLY(sv) && !SvOK(sv)) {
1675             if (ckWARN(WARN_UNINITIALIZED))
1676                 report_uninit(sv);
1677             return 0;
1678         }
1679     }
1680     if (SvIOKp(sv)) {
1681     }
1682     else if (SvNOKp(sv)) {
1683         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1684          * without also getting a cached IV/UV from it at the same time
1685          * (ie PV->NV conversion should detect loss of accuracy and cache
1686          * IV or UV at same time to avoid this.  NWC */
1687
1688         if (SvTYPE(sv) == SVt_NV)
1689             sv_upgrade(sv, SVt_PVNV);
1690
1691         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1692         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1693            certainly cast into the IV range at IV_MAX, whereas the correct
1694            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1695            cases go to UV */
1696         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1697             SvIV_set(sv, I_V(SvNVX(sv)));
1698             if (SvNVX(sv) == (NV) SvIVX(sv)
1699 #ifndef NV_PRESERVES_UV
1700                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1701                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1702                 /* Don't flag it as "accurately an integer" if the number
1703                    came from a (by definition imprecise) NV operation, and
1704                    we're outside the range of NV integer precision */
1705 #endif
1706                 ) {
1707                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1708                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1709                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1710                                       PTR2UV(sv),
1711                                       SvNVX(sv),
1712                                       SvIVX(sv)));
1713
1714             } else {
1715                 /* IV not precise.  No need to convert from PV, as NV
1716                    conversion would already have cached IV if it detected
1717                    that PV->IV would be better than PV->NV->IV
1718                    flags already correct - don't set public IOK.  */
1719                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1720                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1721                                       PTR2UV(sv),
1722                                       SvNVX(sv),
1723                                       SvIVX(sv)));
1724             }
1725             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1726                but the cast (NV)IV_MIN rounds to a the value less (more
1727                negative) than IV_MIN which happens to be equal to SvNVX ??
1728                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1729                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1730                (NV)UVX == NVX are both true, but the values differ. :-(
1731                Hopefully for 2s complement IV_MIN is something like
1732                0x8000000000000000 which will be exact. NWC */
1733         }
1734         else {
1735             SvUV_set(sv, U_V(SvNVX(sv)));
1736             if (
1737                 (SvNVX(sv) == (NV) SvUVX(sv))
1738 #ifndef  NV_PRESERVES_UV
1739                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1740                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1741                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1742                 /* Don't flag it as "accurately an integer" if the number
1743                    came from a (by definition imprecise) NV operation, and
1744                    we're outside the range of NV integer precision */
1745 #endif
1746                 )
1747                 SvIOK_on(sv);
1748             SvIsUV_on(sv);
1749             DEBUG_c(PerlIO_printf(Perl_debug_log,
1750                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1751                                   PTR2UV(sv),
1752                                   SvUVX(sv),
1753                                   SvUVX(sv)));
1754         }
1755     }
1756     else if (SvPOKp(sv) && SvLEN(sv)) {
1757         UV value;
1758         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1759         /* We want to avoid a possible problem when we cache an IV which
1760            may be later translated to an NV, and the resulting NV is not
1761            the same as the direct translation of the initial string
1762            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1763            be careful to ensure that the value with the .456 is around if the
1764            NV value is requested in the future).
1765         
1766            This means that if we cache such an IV, we need to cache the
1767            NV as well.  Moreover, we trade speed for space, and do not
1768            cache the NV if we are sure it's not needed.
1769          */
1770
1771         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1772         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1773              == IS_NUMBER_IN_UV) {
1774             /* It's definitely an integer, only upgrade to PVIV */
1775             if (SvTYPE(sv) < SVt_PVIV)
1776                 sv_upgrade(sv, SVt_PVIV);
1777             (void)SvIOK_on(sv);
1778         } else if (SvTYPE(sv) < SVt_PVNV)
1779             sv_upgrade(sv, SVt_PVNV);
1780
1781         /* If NV preserves UV then we only use the UV value if we know that
1782            we aren't going to call atof() below. If NVs don't preserve UVs
1783            then the value returned may have more precision than atof() will
1784            return, even though value isn't perfectly accurate.  */
1785         if ((numtype & (IS_NUMBER_IN_UV
1786 #ifdef NV_PRESERVES_UV
1787                         | IS_NUMBER_NOT_INT
1788 #endif
1789             )) == IS_NUMBER_IN_UV) {
1790             /* This won't turn off the public IOK flag if it was set above  */
1791             (void)SvIOKp_on(sv);
1792
1793             if (!(numtype & IS_NUMBER_NEG)) {
1794                 /* positive */;
1795                 if (value <= (UV)IV_MAX) {
1796                     SvIV_set(sv, (IV)value);
1797                 } else {
1798                     SvUV_set(sv, value);
1799                     SvIsUV_on(sv);
1800                 }
1801             } else {
1802                 /* 2s complement assumption  */
1803                 if (value <= (UV)IV_MIN) {
1804                     SvIV_set(sv, -(IV)value);
1805                 } else {
1806                     /* Too negative for an IV.  This is a double upgrade, but
1807                        I'm assuming it will be rare.  */
1808                     if (SvTYPE(sv) < SVt_PVNV)
1809                         sv_upgrade(sv, SVt_PVNV);
1810                     SvNOK_on(sv);
1811                     SvIOK_off(sv);
1812                     SvIOKp_on(sv);
1813                     SvNV_set(sv, -(NV)value);
1814                     SvIV_set(sv, IV_MIN);
1815                 }
1816             }
1817         }
1818         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1819            will be in the previous block to set the IV slot, and the next
1820            block to set the NV slot.  So no else here.  */
1821         
1822         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1823             != IS_NUMBER_IN_UV) {
1824             /* It wasn't an (integer that doesn't overflow the UV). */
1825             SvNV_set(sv, Atof(SvPVX_const(sv)));
1826
1827             if (! numtype && ckWARN(WARN_NUMERIC))
1828                 not_a_number(sv);
1829
1830 #if defined(USE_LONG_DOUBLE)
1831             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1832                                   PTR2UV(sv), SvNVX(sv)));
1833 #else
1834             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1835                                   PTR2UV(sv), SvNVX(sv)));
1836 #endif
1837
1838
1839 #ifdef NV_PRESERVES_UV
1840             (void)SvIOKp_on(sv);
1841             (void)SvNOK_on(sv);
1842             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1843                 SvIV_set(sv, I_V(SvNVX(sv)));
1844                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1845                     SvIOK_on(sv);
1846                 } else {
1847                     /* Integer is imprecise. NOK, IOKp */
1848                 }
1849                 /* UV will not work better than IV */
1850             } else {
1851                 if (SvNVX(sv) > (NV)UV_MAX) {
1852                     SvIsUV_on(sv);
1853                     /* Integer is inaccurate. NOK, IOKp, is UV */
1854                     SvUV_set(sv, UV_MAX);
1855                     SvIsUV_on(sv);
1856                 } else {
1857                     SvUV_set(sv, U_V(SvNVX(sv)));
1858                     /* 0xFFFFFFFFFFFFFFFF not an issue in here */
1859                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1860                         SvIOK_on(sv);
1861                         SvIsUV_on(sv);
1862                     } else {
1863                         /* Integer is imprecise. NOK, IOKp, is UV */
1864                         SvIsUV_on(sv);
1865                     }
1866                 }
1867             }
1868 #else /* NV_PRESERVES_UV */
1869             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1870                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1871                 /* The IV slot will have been set from value returned by
1872                    grok_number above.  The NV slot has just been set using
1873                    Atof.  */
1874                 SvNOK_on(sv);
1875                 assert (SvIOKp(sv));
1876             } else {
1877                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1878                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1879                     /* Small enough to preserve all bits. */
1880                     (void)SvIOKp_on(sv);
1881                     SvNOK_on(sv);
1882                     SvIV_set(sv, I_V(SvNVX(sv)));
1883                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1884                         SvIOK_on(sv);
1885                     /* Assumption: first non-preserved integer is < IV_MAX,
1886                        this NV is in the preserved range, therefore: */
1887                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1888                           < (UV)IV_MAX)) {
1889                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1890                     }
1891                 } else {
1892                     /* IN_UV NOT_INT
1893                          0      0       already failed to read UV.
1894                          0      1       already failed to read UV.
1895                          1      0       you won't get here in this case. IV/UV
1896                                         slot set, public IOK, Atof() unneeded.
1897                          1      1       already read UV.
1898                        so there's no point in sv_2iuv_non_preserve() attempting
1899                        to use atol, strtol, strtoul etc.  */
1900                     sv_2iuv_non_preserve (sv, numtype);
1901                 }
1902             }
1903 #endif /* NV_PRESERVES_UV */
1904         }
1905     } else  {
1906         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
1907             report_uninit(sv);
1908         if (SvTYPE(sv) < SVt_IV)
1909             /* Typically the caller expects that sv_any is not NULL now.  */
1910             sv_upgrade(sv, SVt_IV);
1911         return 0;
1912     }
1913     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1914         PTR2UV(sv),SvIVX(sv)));
1915     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1916 }
1917
1918 /*
1919 =for apidoc sv_2uv_flags
1920
1921 Return the unsigned integer value of an SV, doing any necessary string
1922 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1923 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1924
1925 =cut
1926 */
1927
1928 UV
1929 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1930 {
1931     if (!sv)
1932         return 0;
1933     if (SvGMAGICAL(sv)) {
1934         if (flags & SV_GMAGIC)
1935             mg_get(sv);
1936         if (SvIOKp(sv))
1937             return SvUVX(sv);
1938         if (SvNOKp(sv))
1939             return U_V(SvNVX(sv));
1940         if (SvPOKp(sv) && SvLEN(sv))
1941             return asUV(sv);
1942         if (!SvROK(sv)) {
1943             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1944                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1945                     report_uninit(sv);
1946             }
1947             return 0;
1948         }
1949     }
1950     if (SvTHINKFIRST(sv)) {
1951         if (SvROK(sv)) {
1952           SV* tmpstr;
1953           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
1954                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
1955               return SvUV(tmpstr);
1956           return PTR2UV(SvRV(sv));
1957         }
1958         if (SvIsCOW(sv)) {
1959             sv_force_normal_flags(sv, 0);
1960         }
1961         if (SvREADONLY(sv) && !SvOK(sv)) {
1962             if (ckWARN(WARN_UNINITIALIZED))
1963                 report_uninit(sv);
1964             return 0;
1965         }
1966     }
1967     if (SvIOKp(sv)) {
1968     }
1969     else if (SvNOKp(sv)) {
1970         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1971          * without also getting a cached IV/UV from it at the same time
1972          * (ie PV->NV conversion should detect loss of accuracy and cache
1973          * IV or UV at same time to avoid this. */
1974         /* IV-over-UV optimisation - choose to cache IV if possible */
1975
1976         if (SvTYPE(sv) == SVt_NV)
1977             sv_upgrade(sv, SVt_PVNV);
1978
1979         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1980         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1981             SvIV_set(sv, I_V(SvNVX(sv)));
1982             if (SvNVX(sv) == (NV) SvIVX(sv)
1983 #ifndef NV_PRESERVES_UV
1984                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1985                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1986                 /* Don't flag it as "accurately an integer" if the number
1987                    came from a (by definition imprecise) NV operation, and
1988                    we're outside the range of NV integer precision */
1989 #endif
1990                 ) {
1991                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1992                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1993                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (precise)\n",
1994                                       PTR2UV(sv),
1995                                       SvNVX(sv),
1996                                       SvIVX(sv)));
1997
1998             } else {
1999                 /* IV not precise.  No need to convert from PV, as NV
2000                    conversion would already have cached IV if it detected
2001                    that PV->IV would be better than PV->NV->IV
2002                    flags already correct - don't set public IOK.  */
2003                 DEBUG_c(PerlIO_printf(Perl_debug_log,
2004                                       "0x%"UVxf" uv(%"NVgf" => %"IVdf") (imprecise)\n",
2005                                       PTR2UV(sv),
2006                                       SvNVX(sv),
2007                                       SvIVX(sv)));
2008             }
2009             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
2010                but the cast (NV)IV_MIN rounds to a the value less (more
2011                negative) than IV_MIN which happens to be equal to SvNVX ??
2012                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
2013                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
2014                (NV)UVX == NVX are both true, but the values differ. :-(
2015                Hopefully for 2s complement IV_MIN is something like
2016                0x8000000000000000 which will be exact. NWC */
2017         }
2018         else {
2019             SvUV_set(sv, U_V(SvNVX(sv)));
2020             if (
2021                 (SvNVX(sv) == (NV) SvUVX(sv))
2022 #ifndef  NV_PRESERVES_UV
2023                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
2024                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
2025                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
2026                 /* Don't flag it as "accurately an integer" if the number
2027                    came from a (by definition imprecise) NV operation, and
2028                    we're outside the range of NV integer precision */
2029 #endif
2030                 )
2031                 SvIOK_on(sv);
2032             SvIsUV_on(sv);
2033             DEBUG_c(PerlIO_printf(Perl_debug_log,
2034                                   "0x%"UVxf" 2uv(%"UVuf" => %"IVdf") (as unsigned)\n",
2035                                   PTR2UV(sv),
2036                                   SvUVX(sv),
2037                                   SvUVX(sv)));
2038         }
2039     }
2040     else if (SvPOKp(sv) && SvLEN(sv)) {
2041         UV value;
2042         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2043
2044         /* We want to avoid a possible problem when we cache a UV which
2045            may be later translated to an NV, and the resulting NV is not
2046            the translation of the initial data.
2047         
2048            This means that if we cache such a UV, we need to cache the
2049            NV as well.  Moreover, we trade speed for space, and do not
2050            cache the NV if not needed.
2051          */
2052
2053         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
2054         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2055              == IS_NUMBER_IN_UV) {
2056             /* It's definitely an integer, only upgrade to PVIV */
2057             if (SvTYPE(sv) < SVt_PVIV)
2058                 sv_upgrade(sv, SVt_PVIV);
2059             (void)SvIOK_on(sv);
2060         } else if (SvTYPE(sv) < SVt_PVNV)
2061             sv_upgrade(sv, SVt_PVNV);
2062
2063         /* If NV preserves UV then we only use the UV value if we know that
2064            we aren't going to call atof() below. If NVs don't preserve UVs
2065            then the value returned may have more precision than atof() will
2066            return, even though it isn't accurate.  */
2067         if ((numtype & (IS_NUMBER_IN_UV
2068 #ifdef NV_PRESERVES_UV
2069                         | IS_NUMBER_NOT_INT
2070 #endif
2071             )) == IS_NUMBER_IN_UV) {
2072             /* This won't turn off the public IOK flag if it was set above  */
2073             (void)SvIOKp_on(sv);
2074
2075             if (!(numtype & IS_NUMBER_NEG)) {
2076                 /* positive */;
2077                 if (value <= (UV)IV_MAX) {
2078                     SvIV_set(sv, (IV)value);
2079                 } else {
2080                     /* it didn't overflow, and it was positive. */
2081                     SvUV_set(sv, value);
2082                     SvIsUV_on(sv);
2083                 }
2084             } else {
2085                 /* 2s complement assumption  */
2086                 if (value <= (UV)IV_MIN) {
2087                     SvIV_set(sv, -(IV)value);
2088                 } else {
2089                     /* Too negative for an IV.  This is a double upgrade, but
2090                        I'm assuming it will be rare.  */
2091                     if (SvTYPE(sv) < SVt_PVNV)
2092                         sv_upgrade(sv, SVt_PVNV);
2093                     SvNOK_on(sv);
2094                     SvIOK_off(sv);
2095                     SvIOKp_on(sv);
2096                     SvNV_set(sv, -(NV)value);
2097                     SvIV_set(sv, IV_MIN);
2098                 }
2099             }
2100         }
2101         
2102         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2103             != IS_NUMBER_IN_UV) {
2104             /* It wasn't an integer, or it overflowed the UV. */
2105             SvNV_set(sv, Atof(SvPVX_const(sv)));
2106
2107             if (! numtype && ckWARN(WARN_NUMERIC))
2108                     not_a_number(sv);
2109
2110 #if defined(USE_LONG_DOUBLE)
2111             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%" PERL_PRIgldbl ")\n",
2112                                   PTR2UV(sv), SvNVX(sv)));
2113 #else
2114             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"NVgf")\n",
2115                                   PTR2UV(sv), SvNVX(sv)));
2116 #endif
2117
2118 #ifdef NV_PRESERVES_UV
2119             (void)SvIOKp_on(sv);
2120             (void)SvNOK_on(sv);
2121             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2122                 SvIV_set(sv, I_V(SvNVX(sv)));
2123                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
2124                     SvIOK_on(sv);
2125                 } else {
2126                     /* Integer is imprecise. NOK, IOKp */
2127                 }
2128                 /* UV will not work better than IV */
2129             } else {
2130                 if (SvNVX(sv) > (NV)UV_MAX) {
2131                     SvIsUV_on(sv);
2132                     /* Integer is inaccurate. NOK, IOKp, is UV */
2133                     SvUV_set(sv, UV_MAX);
2134                     SvIsUV_on(sv);
2135                 } else {
2136                     SvUV_set(sv, U_V(SvNVX(sv)));
2137                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
2138                        NV preservse UV so can do correct comparison.  */
2139                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
2140                         SvIOK_on(sv);
2141                         SvIsUV_on(sv);
2142                     } else {
2143                         /* Integer is imprecise. NOK, IOKp, is UV */
2144                         SvIsUV_on(sv);
2145                     }
2146                 }
2147             }
2148 #else /* NV_PRESERVES_UV */
2149             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2150                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
2151                 /* The UV slot will have been set from value returned by
2152                    grok_number above.  The NV slot has just been set using
2153                    Atof.  */
2154                 SvNOK_on(sv);
2155                 assert (SvIOKp(sv));
2156             } else {
2157                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
2158                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2159                     /* Small enough to preserve all bits. */
2160                     (void)SvIOKp_on(sv);
2161                     SvNOK_on(sv);
2162                     SvIV_set(sv, I_V(SvNVX(sv)));
2163                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
2164                         SvIOK_on(sv);
2165                     /* Assumption: first non-preserved integer is < IV_MAX,
2166                        this NV is in the preserved range, therefore: */
2167                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
2168                           < (UV)IV_MAX)) {
2169                         Perl_croak(aTHX_ "sv_2uv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
2170                     }
2171                 } else
2172                     sv_2iuv_non_preserve (sv, numtype);
2173             }
2174 #endif /* NV_PRESERVES_UV */
2175         }
2176     }
2177     else  {
2178         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2179             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2180                 report_uninit(sv);
2181         }
2182         if (SvTYPE(sv) < SVt_IV)
2183             /* Typically the caller expects that sv_any is not NULL now.  */
2184             sv_upgrade(sv, SVt_IV);
2185         return 0;
2186     }
2187
2188     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2189                           PTR2UV(sv),SvUVX(sv)));
2190     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2191 }
2192
2193 /*
2194 =for apidoc sv_2nv
2195
2196 Return the num value of an SV, doing any necessary string or integer
2197 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2198 macros.
2199
2200 =cut
2201 */
2202
2203 NV
2204 Perl_sv_2nv(pTHX_ register SV *sv)
2205 {
2206     if (!sv)
2207         return 0.0;
2208     if (SvGMAGICAL(sv)) {
2209         mg_get(sv);
2210         if (SvNOKp(sv))
2211             return SvNVX(sv);
2212         if (SvPOKp(sv) && SvLEN(sv)) {
2213             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2214                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2215                 not_a_number(sv);
2216             return Atof(SvPVX_const(sv));
2217         }
2218         if (SvIOKp(sv)) {
2219             if (SvIsUV(sv))
2220                 return (NV)SvUVX(sv);
2221             else
2222                 return (NV)SvIVX(sv);
2223         }       
2224         if (!SvROK(sv)) {
2225             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2226                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2227                     report_uninit(sv);
2228             }
2229             return (NV)0;
2230         }
2231     }
2232     if (SvTHINKFIRST(sv)) {
2233         if (SvROK(sv)) {
2234           SV* tmpstr;
2235           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2236                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2237               return SvNV(tmpstr);
2238           return PTR2NV(SvRV(sv));
2239         }
2240         if (SvIsCOW(sv)) {
2241             sv_force_normal_flags(sv, 0);
2242         }
2243         if (SvREADONLY(sv) && !SvOK(sv)) {
2244             if (ckWARN(WARN_UNINITIALIZED))
2245                 report_uninit(sv);
2246             return 0.0;
2247         }
2248     }
2249     if (SvTYPE(sv) < SVt_NV) {
2250         if (SvTYPE(sv) == SVt_IV)
2251             sv_upgrade(sv, SVt_PVNV);
2252         else
2253             sv_upgrade(sv, SVt_NV);
2254 #ifdef USE_LONG_DOUBLE
2255         DEBUG_c({
2256             STORE_NUMERIC_LOCAL_SET_STANDARD();
2257             PerlIO_printf(Perl_debug_log,
2258                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2259                           PTR2UV(sv), SvNVX(sv));
2260             RESTORE_NUMERIC_LOCAL();
2261         });
2262 #else
2263         DEBUG_c({
2264             STORE_NUMERIC_LOCAL_SET_STANDARD();
2265             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2266                           PTR2UV(sv), SvNVX(sv));
2267             RESTORE_NUMERIC_LOCAL();
2268         });
2269 #endif
2270     }
2271     else if (SvTYPE(sv) < SVt_PVNV)
2272         sv_upgrade(sv, SVt_PVNV);
2273     if (SvNOKp(sv)) {
2274         return SvNVX(sv);
2275     }
2276     if (SvIOKp(sv)) {
2277         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2278 #ifdef NV_PRESERVES_UV
2279         SvNOK_on(sv);
2280 #else
2281         /* Only set the public NV OK flag if this NV preserves the IV  */
2282         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2283         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2284                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2285             SvNOK_on(sv);
2286         else
2287             SvNOKp_on(sv);
2288 #endif
2289     }
2290     else if (SvPOKp(sv) && SvLEN(sv)) {
2291         UV value;
2292         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2293         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2294             not_a_number(sv);
2295 #ifdef NV_PRESERVES_UV
2296         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2297             == IS_NUMBER_IN_UV) {
2298             /* It's definitely an integer */
2299             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2300         } else
2301             SvNV_set(sv, Atof(SvPVX_const(sv)));
2302         SvNOK_on(sv);
2303 #else
2304         SvNV_set(sv, Atof(SvPVX_const(sv)));
2305         /* Only set the public NV OK flag if this NV preserves the value in
2306            the PV at least as well as an IV/UV would.
2307            Not sure how to do this 100% reliably. */
2308         /* if that shift count is out of range then Configure's test is
2309            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2310            UV_BITS */
2311         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2312             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2313             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2314         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2315             /* Can't use strtol etc to convert this string, so don't try.
2316                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2317             SvNOK_on(sv);
2318         } else {
2319             /* value has been set.  It may not be precise.  */
2320             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2321                 /* 2s complement assumption for (UV)IV_MIN  */
2322                 SvNOK_on(sv); /* Integer is too negative.  */
2323             } else {
2324                 SvNOKp_on(sv);
2325                 SvIOKp_on(sv);
2326
2327                 if (numtype & IS_NUMBER_NEG) {
2328                     SvIV_set(sv, -(IV)value);
2329                 } else if (value <= (UV)IV_MAX) {
2330                     SvIV_set(sv, (IV)value);
2331                 } else {
2332                     SvUV_set(sv, value);
2333                     SvIsUV_on(sv);
2334                 }
2335
2336                 if (numtype & IS_NUMBER_NOT_INT) {
2337                     /* I believe that even if the original PV had decimals,
2338                        they are lost beyond the limit of the FP precision.
2339                        However, neither is canonical, so both only get p
2340                        flags.  NWC, 2000/11/25 */
2341                     /* Both already have p flags, so do nothing */
2342                 } else {
2343                     const NV nv = SvNVX(sv);
2344                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2345                         if (SvIVX(sv) == I_V(nv)) {
2346                             SvNOK_on(sv);
2347                             SvIOK_on(sv);
2348                         } else {
2349                             SvIOK_on(sv);
2350                             /* It had no "." so it must be integer.  */
2351                         }
2352                     } else {
2353                         /* between IV_MAX and NV(UV_MAX).
2354                            Could be slightly > UV_MAX */
2355
2356                         if (numtype & IS_NUMBER_NOT_INT) {
2357                             /* UV and NV both imprecise.  */
2358                         } else {
2359                             const UV nv_as_uv = U_V(nv);
2360
2361                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2362                                 SvNOK_on(sv);
2363                                 SvIOK_on(sv);
2364                             } else {
2365                                 SvIOK_on(sv);
2366                             }
2367                         }
2368                     }
2369                 }
2370             }
2371         }
2372 #endif /* NV_PRESERVES_UV */
2373     }
2374     else  {
2375         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2376             report_uninit(sv);
2377         if (SvTYPE(sv) < SVt_NV)
2378             /* Typically the caller expects that sv_any is not NULL now.  */
2379             /* XXX Ilya implies that this is a bug in callers that assume this
2380                and ideally should be fixed.  */
2381             sv_upgrade(sv, SVt_NV);
2382         return 0.0;
2383     }
2384 #if defined(USE_LONG_DOUBLE)
2385     DEBUG_c({
2386         STORE_NUMERIC_LOCAL_SET_STANDARD();
2387         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2388                       PTR2UV(sv), SvNVX(sv));
2389         RESTORE_NUMERIC_LOCAL();
2390     });
2391 #else
2392     DEBUG_c({
2393         STORE_NUMERIC_LOCAL_SET_STANDARD();
2394         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2395                       PTR2UV(sv), SvNVX(sv));
2396         RESTORE_NUMERIC_LOCAL();
2397     });
2398 #endif
2399     return SvNVX(sv);
2400 }
2401
2402 /* asIV(): extract an integer from the string value of an SV.
2403  * Caller must validate PVX  */
2404
2405 STATIC IV
2406 S_asIV(pTHX_ SV *sv)
2407 {
2408     UV value;
2409     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2410
2411     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2412         == IS_NUMBER_IN_UV) {
2413         /* It's definitely an integer */
2414         if (numtype & IS_NUMBER_NEG) {
2415             if (value < (UV)IV_MIN)
2416                 return -(IV)value;
2417         } else {
2418             if (value < (UV)IV_MAX)
2419                 return (IV)value;
2420         }
2421     }
2422     if (!numtype) {
2423         if (ckWARN(WARN_NUMERIC))
2424             not_a_number(sv);
2425     }
2426     return I_V(Atof(SvPVX_const(sv)));
2427 }
2428
2429 /* asUV(): extract an unsigned integer from the string value of an SV
2430  * Caller must validate PVX  */
2431
2432 STATIC UV
2433 S_asUV(pTHX_ SV *sv)
2434 {
2435     UV value;
2436     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2437
2438     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2439         == IS_NUMBER_IN_UV) {
2440         /* It's definitely an integer */
2441         if (!(numtype & IS_NUMBER_NEG))
2442             return value;
2443     }
2444     if (!numtype) {
2445         if (ckWARN(WARN_NUMERIC))
2446             not_a_number(sv);
2447     }
2448     return U_V(Atof(SvPVX_const(sv)));
2449 }
2450
2451 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2452  * UV as a string towards the end of buf, and return pointers to start and
2453  * end of it.
2454  *
2455  * We assume that buf is at least TYPE_CHARS(UV) long.
2456  */
2457
2458 static char *
2459 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2460 {
2461     char *ptr = buf + TYPE_CHARS(UV);
2462     char * const ebuf = ptr;
2463     int sign;
2464
2465     if (is_uv)
2466         sign = 0;
2467     else if (iv >= 0) {
2468         uv = iv;
2469         sign = 0;
2470     } else {
2471         uv = -iv;
2472         sign = 1;
2473     }
2474     do {
2475         *--ptr = '0' + (char)(uv % 10);
2476     } while (uv /= 10);
2477     if (sign)
2478         *--ptr = '-';
2479     *peob = ebuf;
2480     return ptr;
2481 }
2482
2483 /*
2484 =for apidoc sv_2pv_flags
2485
2486 Returns a pointer to the string value of an SV, and sets *lp to its length.
2487 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2488 if necessary.
2489 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2490 usually end up here too.
2491
2492 =cut
2493 */
2494
2495 char *
2496 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2497 {
2498     register char *s;
2499     int olderrno;
2500
2501     if (!sv) {
2502         if (lp)
2503             *lp = 0;
2504         return (char *)"";
2505     }
2506     if (SvGMAGICAL(sv)) {
2507         if (flags & SV_GMAGIC)
2508             mg_get(sv);
2509         if (SvPOKp(sv)) {
2510             if (lp)
2511                 *lp = SvCUR(sv);
2512             if (flags & SV_MUTABLE_RETURN)
2513                 return SvPVX_mutable(sv);
2514             if (flags & SV_CONST_RETURN)
2515                 return (char *)SvPVX_const(sv);
2516             return SvPVX(sv);
2517         }
2518         if (SvIOKp(sv) || SvNOKp(sv)) {
2519             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2520             STRLEN len;
2521
2522             if (SvIOKp(sv)) {
2523                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2524                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2525             } else {
2526                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2527                 len = strlen(tbuf);
2528             }
2529             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2530                 /* Sneaky stuff here */
2531                 SV *tsv = newSVpvn(tbuf, len);
2532
2533                 sv_2mortal(tsv);
2534                 if (lp)
2535                     *lp = SvCUR(tsv);
2536                 return SvPVX(tsv);
2537             }
2538             else {
2539                 dVAR;
2540
2541 #ifdef FIXNEGATIVEZERO
2542                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2543                     tbuf[0] = '0';
2544                     tbuf[1] = 0;
2545                     len = 1;
2546                 }
2547 #endif
2548                 SvUPGRADE(sv, SVt_PV);
2549                 if (lp)
2550                     *lp = len;
2551                 s = SvGROW_mutable(sv, len + 1);
2552                 SvCUR_set(sv, len);
2553                 SvPOKp_on(sv);
2554                 return memcpy(s, tbuf, len + 1);
2555             }
2556         }
2557         if (!SvROK(sv)) {
2558             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2559                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2560                     report_uninit(sv);
2561             }
2562             if (lp)
2563                 *lp = 0;
2564             return (char *)"";
2565         }
2566     }
2567     if (SvTHINKFIRST(sv)) {
2568         if (SvROK(sv)) {
2569             SV* tmpstr;
2570
2571             if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,string)) &&
2572                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2573                 /* Unwrap this:  */
2574                 /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr); */
2575
2576                 char *pv;
2577                 if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2578                     if (flags & SV_CONST_RETURN) {
2579                         pv = (char *) SvPVX_const(tmpstr);
2580                     } else {
2581                         pv = (flags & SV_MUTABLE_RETURN)
2582                             ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2583                     }
2584                     if (lp)
2585                         *lp = SvCUR(tmpstr);
2586                 } else {
2587                     pv = sv_2pv_flags(tmpstr, lp, flags);
2588                 }
2589                 if (SvUTF8(tmpstr))
2590                     SvUTF8_on(sv);
2591                 else
2592                     SvUTF8_off(sv);
2593                 return pv;
2594             } else {
2595                 SV *tsv;
2596                 MAGIC *mg;
2597                 const SV *const referent = (SV*)SvRV(sv);
2598
2599                 if (!referent) {
2600                     tsv = sv_2mortal(newSVpvn("NULLREF", 7));
2601                 } else if (SvTYPE(referent) == SVt_PVMG
2602                            && ((SvFLAGS(referent) &
2603                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2604                                == (SVs_OBJECT|SVs_SMG))
2605                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2606                     const regexp *re = (regexp *)mg->mg_obj;
2607
2608                     if (!mg->mg_ptr) {
2609                         const char *fptr = "msix";
2610                         char reflags[6];
2611                         char ch;
2612                         int left = 0;
2613                         int right = 4;
2614                         char need_newline = 0;
2615                         U16 reganch =
2616                             (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2617
2618                         while((ch = *fptr++)) {
2619                             if(reganch & 1) {
2620                                 reflags[left++] = ch;
2621                             }
2622                             else {
2623                                 reflags[right--] = ch;
2624                             }
2625                             reganch >>= 1;
2626                         }
2627                         if(left != 4) {
2628                             reflags[left] = '-';
2629                             left = 5;
2630                         }
2631
2632                         mg->mg_len = re->prelen + 4 + left;
2633                         /*
2634                          * If /x was used, we have to worry about a regex
2635                          * ending with a comment later being embedded
2636                          * within another regex. If so, we don't want this
2637                          * regex's "commentization" to leak out to the
2638                          * right part of the enclosing regex, we must cap
2639                          * it with a newline.
2640                          *
2641                          * So, if /x was used, we scan backwards from the
2642                          * end of the regex. If we find a '#' before we
2643                          * find a newline, we need to add a newline
2644                          * ourself. If we find a '\n' first (or if we
2645                          * don't find '#' or '\n'), we don't need to add
2646                          * anything.  -jfriedl
2647                          */
2648                         if (PMf_EXTENDED & re->reganch) {
2649                             const char *endptr = re->precomp + re->prelen;
2650                             while (endptr >= re->precomp) {
2651                                 const char c = *(endptr--);
2652                                 if (c == '\n')
2653                                     break; /* don't need another */
2654                                 if (c == '#') {
2655                                     /* we end while in a comment, so we
2656                                        need a newline */
2657                                     mg->mg_len++; /* save space for it */
2658                                     need_newline = 1; /* note to add it */
2659                                     break;
2660                                 }
2661                             }
2662                         }
2663
2664                         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2665                         mg->mg_ptr[0] = '(';
2666                         mg->mg_ptr[1] = '?';
2667                         Copy(reflags, mg->mg_ptr+2, left, char);
2668                         *(mg->mg_ptr+left+2) = ':';
2669                         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2670                         if (need_newline)
2671                             mg->mg_ptr[mg->mg_len - 2] = '\n';
2672                         mg->mg_ptr[mg->mg_len - 1] = ')';
2673                         mg->mg_ptr[mg->mg_len] = 0;
2674                     }
2675                     PL_reginterp_cnt += re->program[0].next_off;
2676
2677                     if (re->reganch & ROPT_UTF8)
2678                         SvUTF8_on(sv);
2679                     else
2680                         SvUTF8_off(sv);
2681                     if (lp)
2682                         *lp = mg->mg_len;
2683                     return mg->mg_ptr;
2684                 } else {
2685                     const char *const typestr = sv_reftype(referent, 0);
2686
2687                     tsv = sv_newmortal();
2688                     if (SvOBJECT(referent)) {
2689                         const char *const name = HvNAME_get(SvSTASH(referent));
2690                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2691                                        name ? name : "__ANON__" , typestr,
2692                                        PTR2UV(referent));
2693                     }
2694                     else
2695                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2696                                        PTR2UV(referent));
2697                 }
2698                 if (lp)
2699                     *lp = SvCUR(tsv);
2700                 return SvPVX(tsv);
2701             }
2702         }
2703         if (SvREADONLY(sv) && !SvOK(sv)) {
2704             if (ckWARN(WARN_UNINITIALIZED))
2705                 report_uninit(sv);
2706             if (lp)
2707                 *lp = 0;
2708             return (char *)"";
2709         }
2710     }
2711     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2712         /* I'm assuming that if both IV and NV are equally valid then
2713            converting the IV is going to be more efficient */
2714         const U32 isIOK = SvIOK(sv);
2715         const U32 isUIOK = SvIsUV(sv);
2716         char buf[TYPE_CHARS(UV)];
2717         char *ebuf, *ptr;
2718
2719         if (SvTYPE(sv) < SVt_PVIV)
2720             sv_upgrade(sv, SVt_PVIV);
2721         if (isUIOK)
2722             ptr = uiv_2buf(buf, 0, SvUVX(sv), 1, &ebuf);
2723         else
2724             ptr = uiv_2buf(buf, SvIVX(sv), 0, 0, &ebuf);
2725         /* inlined from sv_setpvn */
2726         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2727         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2728         SvCUR_set(sv, ebuf - ptr);
2729         s = SvEND(sv);
2730         *s = '\0';
2731         if (isIOK)
2732             SvIOK_on(sv);
2733         else
2734             SvIOKp_on(sv);
2735         if (isUIOK)
2736             SvIsUV_on(sv);
2737     }
2738     else if (SvNOKp(sv)) {
2739         if (SvTYPE(sv) < SVt_PVNV)
2740             sv_upgrade(sv, SVt_PVNV);
2741         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2742         s = SvGROW_mutable(sv, NV_DIG + 20);
2743         olderrno = errno;       /* some Xenix systems wipe out errno here */
2744 #ifdef apollo
2745         if (SvNVX(sv) == 0.0)
2746             (void)strcpy(s,"0");
2747         else
2748 #endif /*apollo*/
2749         {
2750             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2751         }
2752         errno = olderrno;
2753 #ifdef FIXNEGATIVEZERO
2754         if (*s == '-' && s[1] == '0' && !s[2])
2755             strcpy(s,"0");
2756 #endif
2757         while (*s) s++;
2758 #ifdef hcx
2759         if (s[-1] == '.')
2760             *--s = '\0';
2761 #endif
2762     }
2763     else {
2764         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2765             report_uninit(sv);
2766         if (lp)
2767         *lp = 0;
2768         if (SvTYPE(sv) < SVt_PV)
2769             /* Typically the caller expects that sv_any is not NULL now.  */
2770             sv_upgrade(sv, SVt_PV);
2771         return (char *)"";
2772     }
2773     {
2774         const STRLEN len = s - SvPVX_const(sv);
2775         if (lp) 
2776             *lp = len;
2777         SvCUR_set(sv, len);
2778     }
2779     SvPOK_on(sv);
2780     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2781                           PTR2UV(sv),SvPVX_const(sv)));
2782     if (flags & SV_CONST_RETURN)
2783         return (char *)SvPVX_const(sv);
2784     if (flags & SV_MUTABLE_RETURN)
2785         return SvPVX_mutable(sv);
2786     return SvPVX(sv);
2787 }
2788
2789 /*
2790 =for apidoc sv_copypv
2791
2792 Copies a stringified representation of the source SV into the
2793 destination SV.  Automatically performs any necessary mg_get and
2794 coercion of numeric values into strings.  Guaranteed to preserve
2795 UTF-8 flag even from overloaded objects.  Similar in nature to
2796 sv_2pv[_flags] but operates directly on an SV instead of just the
2797 string.  Mostly uses sv_2pv_flags to do its work, except when that
2798 would lose the UTF-8'ness of the PV.
2799
2800 =cut
2801 */
2802
2803 void
2804 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2805 {
2806     STRLEN len;
2807     const char * const s = SvPV_const(ssv,len);
2808     sv_setpvn(dsv,s,len);
2809     if (SvUTF8(ssv))
2810         SvUTF8_on(dsv);
2811     else
2812         SvUTF8_off(dsv);
2813 }
2814
2815 /*
2816 =for apidoc sv_2pvbyte
2817
2818 Return a pointer to the byte-encoded representation of the SV, and set *lp
2819 to its length.  May cause the SV to be downgraded from UTF-8 as a
2820 side-effect.
2821
2822 Usually accessed via the C<SvPVbyte> macro.
2823
2824 =cut
2825 */
2826
2827 char *
2828 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2829 {
2830     sv_utf8_downgrade(sv,0);
2831     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2832 }
2833
2834 /*
2835 =for apidoc sv_2pvutf8
2836
2837 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2838 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2839
2840 Usually accessed via the C<SvPVutf8> macro.
2841
2842 =cut
2843 */
2844
2845 char *
2846 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2847 {
2848     sv_utf8_upgrade(sv);
2849     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2850 }
2851
2852
2853 /*
2854 =for apidoc sv_2bool
2855
2856 This function is only called on magical items, and is only used by
2857 sv_true() or its macro equivalent.
2858
2859 =cut
2860 */
2861
2862 bool
2863 Perl_sv_2bool(pTHX_ register SV *sv)
2864 {
2865     SvGETMAGIC(sv);
2866
2867     if (!SvOK(sv))
2868         return 0;
2869     if (SvROK(sv)) {
2870         SV* tmpsv;
2871         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2872                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2873             return (bool)SvTRUE(tmpsv);
2874       return SvRV(sv) != 0;
2875     }
2876     if (SvPOKp(sv)) {
2877         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2878         if (Xpvtmp &&
2879                 (*sv->sv_u.svu_pv > '0' ||
2880                 Xpvtmp->xpv_cur > 1 ||
2881                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2882             return 1;
2883         else
2884             return 0;
2885     }
2886     else {
2887         if (SvIOKp(sv))
2888             return SvIVX(sv) != 0;
2889         else {
2890             if (SvNOKp(sv))
2891                 return SvNVX(sv) != 0.0;
2892             else
2893                 return FALSE;
2894         }
2895     }
2896 }
2897
2898 /*
2899 =for apidoc sv_utf8_upgrade
2900
2901 Converts the PV of an SV to its UTF-8-encoded form.
2902 Forces the SV to string form if it is not already.
2903 Always sets the SvUTF8 flag to avoid future validity checks even
2904 if all the bytes have hibit clear.
2905
2906 This is not as a general purpose byte encoding to Unicode interface:
2907 use the Encode extension for that.
2908
2909 =for apidoc sv_utf8_upgrade_flags
2910
2911 Converts the PV of an SV to its UTF-8-encoded form.
2912 Forces the SV to string form if it is not already.
2913 Always sets the SvUTF8 flag to avoid future validity checks even
2914 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2915 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2916 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2917
2918 This is not as a general purpose byte encoding to Unicode interface:
2919 use the Encode extension for that.
2920
2921 =cut
2922 */
2923
2924 STRLEN
2925 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2926 {
2927     if (sv == &PL_sv_undef)
2928         return 0;
2929     if (!SvPOK(sv)) {
2930         STRLEN len = 0;
2931         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2932             (void) sv_2pv_flags(sv,&len, flags);
2933             if (SvUTF8(sv))
2934                 return len;
2935         } else {
2936             (void) SvPV_force(sv,len);
2937         }
2938     }
2939
2940     if (SvUTF8(sv)) {
2941         return SvCUR(sv);
2942     }
2943
2944     if (SvIsCOW(sv)) {
2945         sv_force_normal_flags(sv, 0);
2946     }
2947
2948     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2949         sv_recode_to_utf8(sv, PL_encoding);
2950     else { /* Assume Latin-1/EBCDIC */
2951         /* This function could be much more efficient if we
2952          * had a FLAG in SVs to signal if there are any hibit
2953          * chars in the PV.  Given that there isn't such a flag
2954          * make the loop as fast as possible. */
2955         const U8 *s = (U8 *) SvPVX_const(sv);
2956         const U8 * const e = (U8 *) SvEND(sv);
2957         const U8 *t = s;
2958         int hibit = 0;
2959         
2960         while (t < e) {
2961             const U8 ch = *t++;
2962             if ((hibit = !NATIVE_IS_INVARIANT(ch)))
2963                 break;
2964         }
2965         if (hibit) {
2966             STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2967             U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2968
2969             SvPV_free(sv); /* No longer using what was there before. */
2970
2971             SvPV_set(sv, (char*)recoded);
2972             SvCUR_set(sv, len - 1);
2973             SvLEN_set(sv, len); /* No longer know the real size. */
2974         }
2975         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2976         SvUTF8_on(sv);
2977     }
2978     return SvCUR(sv);
2979 }
2980
2981 /*
2982 =for apidoc sv_utf8_downgrade
2983
2984 Attempts to convert the PV of an SV from characters to bytes.
2985 If the PV contains a character beyond byte, this conversion will fail;
2986 in this case, either returns false or, if C<fail_ok> is not
2987 true, croaks.
2988
2989 This is not as a general purpose Unicode to byte encoding interface:
2990 use the Encode extension for that.
2991
2992 =cut
2993 */
2994
2995 bool
2996 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
2997 {
2998     if (SvPOKp(sv) && SvUTF8(sv)) {
2999         if (SvCUR(sv)) {
3000             U8 *s;
3001             STRLEN len;
3002
3003             if (SvIsCOW(sv)) {
3004                 sv_force_normal_flags(sv, 0);
3005             }
3006             s = (U8 *) SvPV(sv, len);
3007             if (!utf8_to_bytes(s, &len)) {
3008                 if (fail_ok)
3009                     return FALSE;
3010                 else {
3011                     if (PL_op)
3012                         Perl_croak(aTHX_ "Wide character in %s",
3013                                    OP_DESC(PL_op));
3014                     else
3015                         Perl_croak(aTHX_ "Wide character");
3016                 }
3017             }
3018             SvCUR_set(sv, len);
3019         }
3020     }
3021     SvUTF8_off(sv);
3022     return TRUE;
3023 }
3024
3025 /*
3026 =for apidoc sv_utf8_encode
3027
3028 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
3029 flag off so that it looks like octets again.
3030
3031 =cut
3032 */
3033
3034 void
3035 Perl_sv_utf8_encode(pTHX_ register SV *sv)
3036 {
3037     (void) sv_utf8_upgrade(sv);
3038     if (SvIsCOW(sv)) {
3039         sv_force_normal_flags(sv, 0);
3040     }
3041     if (SvREADONLY(sv)) {
3042         Perl_croak(aTHX_ PL_no_modify);
3043     }
3044     SvUTF8_off(sv);
3045 }
3046
3047 /*
3048 =for apidoc sv_utf8_decode
3049
3050 If the PV of the SV is an octet sequence in UTF-8
3051 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
3052 so that it looks like a character. If the PV contains only single-byte
3053 characters, the C<SvUTF8> flag stays being off.
3054 Scans PV for validity and returns false if the PV is invalid UTF-8.
3055
3056 =cut
3057 */
3058
3059 bool
3060 Perl_sv_utf8_decode(pTHX_ register SV *sv)
3061 {
3062     if (SvPOKp(sv)) {
3063         const U8 *c;
3064         const U8 *e;
3065
3066         /* The octets may have got themselves encoded - get them back as
3067          * bytes
3068          */
3069         if (!sv_utf8_downgrade(sv, TRUE))
3070             return FALSE;
3071
3072         /* it is actually just a matter of turning the utf8 flag on, but
3073          * we want to make sure everything inside is valid utf8 first.
3074          */
3075         c = (const U8 *) SvPVX_const(sv);
3076         if (!is_utf8_string(c, SvCUR(sv)+1))
3077             return FALSE;
3078         e = (const U8 *) SvEND(sv);
3079         while (c < e) {
3080             const U8 ch = *c++;
3081             if (!UTF8_IS_INVARIANT(ch)) {
3082                 SvUTF8_on(sv);
3083                 break;
3084             }
3085         }
3086     }
3087     return TRUE;
3088 }
3089
3090 /*
3091 =for apidoc sv_setsv
3092
3093 Copies the contents of the source SV C<ssv> into the destination SV
3094 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3095 function if the source SV needs to be reused. Does not handle 'set' magic.
3096 Loosely speaking, it performs a copy-by-value, obliterating any previous
3097 content of the destination.
3098
3099 You probably want to use one of the assortment of wrappers, such as
3100 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3101 C<SvSetMagicSV_nosteal>.
3102
3103 =for apidoc sv_setsv_flags
3104
3105 Copies the contents of the source SV C<ssv> into the destination SV
3106 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
3107 function if the source SV needs to be reused. Does not handle 'set' magic.
3108 Loosely speaking, it performs a copy-by-value, obliterating any previous
3109 content of the destination.
3110 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
3111 C<ssv> if appropriate, else not. If the C<flags> parameter has the
3112 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
3113 and C<sv_setsv_nomg> are implemented in terms of this function.
3114
3115 You probably want to use one of the assortment of wrappers, such as
3116 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
3117 C<SvSetMagicSV_nosteal>.
3118
3119 This is the primary function for copying scalars, and most other
3120 copy-ish functions and macros use this underneath.
3121
3122 =cut
3123 */
3124
3125 void
3126 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
3127 {
3128     register U32 sflags;
3129     register int dtype;
3130     register int stype;
3131
3132     if (sstr == dstr)
3133         return;
3134     SV_CHECK_THINKFIRST_COW_DROP(dstr);
3135     if (!sstr)
3136         sstr = &PL_sv_undef;
3137     stype = SvTYPE(sstr);
3138     dtype = SvTYPE(dstr);
3139
3140     SvAMAGIC_off(dstr);
3141     if ( SvVOK(dstr) )
3142     {
3143         /* need to nuke the magic */
3144         mg_free(dstr);
3145         SvRMAGICAL_off(dstr);
3146     }
3147
3148     /* There's a lot of redundancy below but we're going for speed here */
3149
3150     switch (stype) {
3151     case SVt_NULL:
3152       undef_sstr:
3153         if (dtype != SVt_PVGV) {
3154             (void)SvOK_off(dstr);
3155             return;
3156         }
3157         break;
3158     case SVt_IV:
3159         if (SvIOK(sstr)) {
3160             switch (dtype) {
3161             case SVt_NULL:
3162                 sv_upgrade(dstr, SVt_IV);
3163                 break;
3164             case SVt_NV:
3165                 sv_upgrade(dstr, SVt_PVNV);
3166                 break;
3167             case SVt_RV:
3168             case SVt_PV:
3169                 sv_upgrade(dstr, SVt_PVIV);
3170                 break;
3171             }
3172             (void)SvIOK_only(dstr);
3173             SvIV_set(dstr,  SvIVX(sstr));
3174             if (SvIsUV(sstr))
3175                 SvIsUV_on(dstr);
3176             if (SvTAINTED(sstr))
3177                 SvTAINT(dstr);
3178             return;
3179         }
3180         goto undef_sstr;
3181
3182     case SVt_NV:
3183         if (SvNOK(sstr)) {
3184             switch (dtype) {
3185             case SVt_NULL:
3186             case SVt_IV:
3187                 sv_upgrade(dstr, SVt_NV);
3188                 break;
3189             case SVt_RV:
3190             case SVt_PV:
3191             case SVt_PVIV:
3192                 sv_upgrade(dstr, SVt_PVNV);
3193                 break;
3194             }
3195             SvNV_set(dstr, SvNVX(sstr));
3196             (void)SvNOK_only(dstr);
3197             if (SvTAINTED(sstr))
3198                 SvTAINT(dstr);
3199             return;
3200         }
3201         goto undef_sstr;
3202
3203     case SVt_RV:
3204         if (dtype < SVt_RV)
3205             sv_upgrade(dstr, SVt_RV);
3206         else if (dtype == SVt_PVGV &&
3207                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
3208             sstr = SvRV(sstr);
3209             if (sstr == dstr) {
3210                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3211                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3212                 {
3213                     GvIMPORTED_on(dstr);
3214                 }
3215                 GvMULTI_on(dstr);
3216                 return;
3217             }
3218             goto glob_assign;
3219         }
3220         break;
3221     case SVt_PVFM:
3222 #ifdef PERL_OLD_COPY_ON_WRITE
3223         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3224             if (dtype < SVt_PVIV)
3225                 sv_upgrade(dstr, SVt_PVIV);
3226             break;
3227         }
3228         /* Fall through */
3229 #endif
3230     case SVt_PV:
3231         if (dtype < SVt_PV)
3232             sv_upgrade(dstr, SVt_PV);
3233         break;
3234     case SVt_PVIV:
3235         if (dtype < SVt_PVIV)
3236             sv_upgrade(dstr, SVt_PVIV);
3237         break;
3238     case SVt_PVNV:
3239         if (dtype < SVt_PVNV)
3240             sv_upgrade(dstr, SVt_PVNV);
3241         break;
3242     case SVt_PVAV:
3243     case SVt_PVHV:
3244     case SVt_PVCV:
3245     case SVt_PVIO:
3246         {
3247         const char * const type = sv_reftype(sstr,0);
3248         if (PL_op)
3249             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3250         else
3251             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3252         }
3253         break;
3254
3255     case SVt_PVGV:
3256         if (dtype <= SVt_PVGV) {
3257   glob_assign:
3258             if (dtype != SVt_PVGV) {
3259                 const char * const name = GvNAME(sstr);
3260                 const STRLEN len = GvNAMELEN(sstr);
3261                 /* don't upgrade SVt_PVLV: it can hold a glob */
3262                 if (dtype != SVt_PVLV)
3263                     sv_upgrade(dstr, SVt_PVGV);
3264                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3265                 GvSTASH(dstr) = GvSTASH(sstr);
3266                 if (GvSTASH(dstr))
3267                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3268                 GvNAME(dstr) = savepvn(name, len);
3269                 GvNAMELEN(dstr) = len;
3270                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3271             }
3272
3273 #ifdef GV_UNIQUE_CHECK
3274                 if (GvUNIQUE((GV*)dstr)) {
3275                     Perl_croak(aTHX_ PL_no_modify);
3276                 }
3277 #endif
3278
3279             (void)SvOK_off(dstr);
3280             GvINTRO_off(dstr);          /* one-shot flag */
3281             gp_free((GV*)dstr);
3282             GvGP(dstr) = gp_ref(GvGP(sstr));
3283             if (SvTAINTED(sstr))
3284                 SvTAINT(dstr);
3285             if (GvIMPORTED(dstr) != GVf_IMPORTED
3286                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3287             {
3288                 GvIMPORTED_on(dstr);
3289             }
3290             GvMULTI_on(dstr);
3291             return;
3292         }
3293         /* FALL THROUGH */
3294
3295     default:
3296         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3297             mg_get(sstr);
3298             if ((int)SvTYPE(sstr) != stype) {
3299                 stype = SvTYPE(sstr);
3300                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3301                     goto glob_assign;
3302             }
3303         }
3304         if (stype == SVt_PVLV)
3305             SvUPGRADE(dstr, SVt_PVNV);
3306         else
3307             SvUPGRADE(dstr, (U32)stype);
3308     }
3309
3310     sflags = SvFLAGS(sstr);
3311
3312     if (sflags & SVf_ROK) {
3313         if (dtype >= SVt_PV) {
3314             if (dtype == SVt_PVGV) {
3315                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3316                 SV *dref = 0;
3317                 const int intro = GvINTRO(dstr);
3318
3319 #ifdef GV_UNIQUE_CHECK
3320                 if (GvUNIQUE((GV*)dstr)) {
3321                     Perl_croak(aTHX_ PL_no_modify);
3322                 }
3323 #endif
3324
3325                 if (intro) {
3326                     GvINTRO_off(dstr);  /* one-shot flag */
3327                     GvLINE(dstr) = CopLINE(PL_curcop);
3328                     GvEGV(dstr) = (GV*)dstr;
3329                 }
3330                 GvMULTI_on(dstr);
3331                 switch (SvTYPE(sref)) {
3332                 case SVt_PVAV:
3333                     if (intro)
3334                         SAVEGENERICSV(GvAV(dstr));
3335                     else
3336                         dref = (SV*)GvAV(dstr);
3337                     GvAV(dstr) = (AV*)sref;
3338                     if (!GvIMPORTED_AV(dstr)
3339                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3340                     {
3341                         GvIMPORTED_AV_on(dstr);
3342                     }
3343                     break;
3344                 case SVt_PVHV:
3345                     if (intro)
3346                         SAVEGENERICSV(GvHV(dstr));
3347                     else
3348                         dref = (SV*)GvHV(dstr);
3349                     GvHV(dstr) = (HV*)sref;
3350                     if (!GvIMPORTED_HV(dstr)
3351                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3352                     {
3353                         GvIMPORTED_HV_on(dstr);
3354                     }
3355                     break;
3356                 case SVt_PVCV:
3357                     if (intro) {
3358                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3359                             SvREFCNT_dec(GvCV(dstr));
3360                             GvCV(dstr) = Nullcv;
3361                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3362                             PL_sub_generation++;
3363                         }
3364                         SAVEGENERICSV(GvCV(dstr));
3365                     }
3366                     else
3367                         dref = (SV*)GvCV(dstr);
3368                     if (GvCV(dstr) != (CV*)sref) {
3369                         CV* const cv = GvCV(dstr);
3370                         if (cv) {
3371                             if (!GvCVGEN((GV*)dstr) &&
3372                                 (CvROOT(cv) || CvXSUB(cv)))
3373                             {
3374                                 /* Redefining a sub - warning is mandatory if
3375                                    it was a const and its value changed. */
3376                                 if (ckWARN(WARN_REDEFINE)
3377                                     || (CvCONST(cv)
3378                                         && (!CvCONST((CV*)sref)
3379                                             || sv_cmp(cv_const_sv(cv),
3380                                                       cv_const_sv((CV*)sref)))))
3381                                 {
3382                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3383                                         CvCONST(cv)
3384                                         ? "Constant subroutine %s::%s redefined"
3385                                         : "Subroutine %s::%s redefined",
3386                                         HvNAME_get(GvSTASH((GV*)dstr)),
3387                                         GvENAME((GV*)dstr));
3388                                 }
3389                             }
3390                             if (!intro)
3391                                 cv_ckproto(cv, (GV*)dstr,
3392                                            SvPOK(sref)
3393                                            ? SvPVX_const(sref) : Nullch);
3394                         }
3395                         GvCV(dstr) = (CV*)sref;
3396                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3397                         GvASSUMECV_on(dstr);
3398                         PL_sub_generation++;
3399                     }
3400                     if (!GvIMPORTED_CV(dstr)
3401                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3402                     {
3403                         GvIMPORTED_CV_on(dstr);
3404                     }
3405                     break;
3406                 case SVt_PVIO:
3407                     if (intro)
3408                         SAVEGENERICSV(GvIOp(dstr));
3409                     else
3410                         dref = (SV*)GvIOp(dstr);
3411                     GvIOp(dstr) = (IO*)sref;
3412                     break;
3413                 case SVt_PVFM:
3414                     if (intro)
3415                         SAVEGENERICSV(GvFORM(dstr));
3416                     else
3417                         dref = (SV*)GvFORM(dstr);
3418                     GvFORM(dstr) = (CV*)sref;
3419                     break;
3420                 default:
3421                     if (intro)
3422                         SAVEGENERICSV(GvSV(dstr));
3423                     else
3424                         dref = (SV*)GvSV(dstr);
3425                     GvSV(dstr) = sref;
3426                     if (!GvIMPORTED_SV(dstr)
3427                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3428                     {
3429                         GvIMPORTED_SV_on(dstr);
3430                     }
3431                     break;
3432                 }
3433                 if (dref)
3434                     SvREFCNT_dec(dref);
3435                 if (SvTAINTED(sstr))
3436                     SvTAINT(dstr);
3437                 return;
3438             }
3439             if (SvPVX_const(dstr)) {
3440                 SvPV_free(dstr);
3441                 SvLEN_set(dstr, 0);
3442                 SvCUR_set(dstr, 0);
3443             }
3444         }
3445         (void)SvOK_off(dstr);
3446         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3447         SvROK_on(dstr);
3448         if (sflags & SVp_NOK) {
3449             SvNOKp_on(dstr);
3450             /* Only set the public OK flag if the source has public OK.  */
3451             if (sflags & SVf_NOK)
3452                 SvFLAGS(dstr) |= SVf_NOK;
3453             SvNV_set(dstr, SvNVX(sstr));
3454         }
3455         if (sflags & SVp_IOK) {
3456             (void)SvIOKp_on(dstr);
3457             if (sflags & SVf_IOK)
3458                 SvFLAGS(dstr) |= SVf_IOK;
3459             if (sflags & SVf_IVisUV)
3460                 SvIsUV_on(dstr);
3461             SvIV_set(dstr, SvIVX(sstr));
3462         }
3463         if (SvAMAGIC(sstr)) {
3464             SvAMAGIC_on(dstr);
3465         }
3466     }
3467     else if (sflags & SVp_POK) {
3468         bool isSwipe = 0;
3469
3470         /*
3471          * Check to see if we can just swipe the string.  If so, it's a
3472          * possible small lose on short strings, but a big win on long ones.
3473          * It might even be a win on short strings if SvPVX_const(dstr)
3474          * has to be allocated and SvPVX_const(sstr) has to be freed.
3475          */
3476
3477         /* Whichever path we take through the next code, we want this true,
3478            and doing it now facilitates the COW check.  */
3479         (void)SvPOK_only(dstr);
3480
3481         if (
3482             /* We're not already COW  */
3483             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3484 #ifndef PERL_OLD_COPY_ON_WRITE
3485              /* or we are, but dstr isn't a suitable target.  */
3486              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3487 #endif
3488              )
3489             &&
3490             !(isSwipe =
3491                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3492                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3493                  (!(flags & SV_NOSTEAL)) &&
3494                                         /* and we're allowed to steal temps */
3495                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3496                  SvLEN(sstr)    &&        /* and really is a string */
3497                                 /* and won't be needed again, potentially */
3498               !(PL_op && PL_op->op_type == OP_AASSIGN))
3499 #ifdef PERL_OLD_COPY_ON_WRITE
3500             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3501                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3502                  && SvTYPE(sstr) >= SVt_PVIV)
3503 #endif
3504             ) {
3505             /* Failed the swipe test, and it's not a shared hash key either.
3506                Have to copy the string.  */
3507             STRLEN len = SvCUR(sstr);
3508             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3509             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3510             SvCUR_set(dstr, len);
3511             *SvEND(dstr) = '\0';
3512         } else {
3513             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3514                be true in here.  */
3515             /* Either it's a shared hash key, or it's suitable for
3516                copy-on-write or we can swipe the string.  */
3517             if (DEBUG_C_TEST) {
3518                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3519                 sv_dump(sstr);
3520                 sv_dump(dstr);
3521             }
3522 #ifdef PERL_OLD_COPY_ON_WRITE
3523             if (!isSwipe) {
3524                 /* I believe I should acquire a global SV mutex if
3525                    it's a COW sv (not a shared hash key) to stop
3526                    it going un copy-on-write.
3527                    If the source SV has gone un copy on write between up there
3528                    and down here, then (assert() that) it is of the correct
3529                    form to make it copy on write again */
3530                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3531                     != (SVf_FAKE | SVf_READONLY)) {
3532                     SvREADONLY_on(sstr);
3533                     SvFAKE_on(sstr);
3534                     /* Make the source SV into a loop of 1.
3535                        (about to become 2) */
3536                     SV_COW_NEXT_SV_SET(sstr, sstr);
3537                 }
3538             }
3539 #endif
3540             /* Initial code is common.  */
3541             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3542                 SvPV_free(dstr);
3543             }
3544
3545             if (!isSwipe) {
3546                 /* making another shared SV.  */
3547                 STRLEN cur = SvCUR(sstr);
3548                 STRLEN len = SvLEN(sstr);
3549 #ifdef PERL_OLD_COPY_ON_WRITE
3550                 if (len) {
3551                     assert (SvTYPE(dstr) >= SVt_PVIV);
3552                     /* SvIsCOW_normal */
3553                     /* splice us in between source and next-after-source.  */
3554                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3555                     SV_COW_NEXT_SV_SET(sstr, dstr);
3556                     SvPV_set(dstr, SvPVX_mutable(sstr));
3557                 } else
3558 #endif
3559                 {
3560                     /* SvIsCOW_shared_hash */
3561                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3562                                           "Copy on write: Sharing hash\n"));
3563
3564                     assert (SvTYPE(dstr) >= SVt_PV);
3565                     SvPV_set(dstr,
3566                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3567                 }
3568                 SvLEN_set(dstr, len);
3569                 SvCUR_set(dstr, cur);
3570                 SvREADONLY_on(dstr);
3571                 SvFAKE_on(dstr);
3572                 /* Relesase a global SV mutex.  */
3573             }
3574             else
3575                 {       /* Passes the swipe test.  */
3576                 SvPV_set(dstr, SvPVX_mutable(sstr));
3577                 SvLEN_set(dstr, SvLEN(sstr));
3578                 SvCUR_set(dstr, SvCUR(sstr));
3579
3580                 SvTEMP_off(dstr);
3581                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3582                 SvPV_set(sstr, Nullch);
3583                 SvLEN_set(sstr, 0);
3584                 SvCUR_set(sstr, 0);
3585                 SvTEMP_off(sstr);
3586             }
3587         }
3588         if (sflags & SVf_UTF8)
3589             SvUTF8_on(dstr);
3590         if (sflags & SVp_NOK) {
3591             SvNOKp_on(dstr);
3592             if (sflags & SVf_NOK)
3593                 SvFLAGS(dstr) |= SVf_NOK;
3594             SvNV_set(dstr, SvNVX(sstr));
3595         }
3596         if (sflags & SVp_IOK) {
3597             (void)SvIOKp_on(dstr);
3598             if (sflags & SVf_IOK)
3599                 SvFLAGS(dstr) |= SVf_IOK;
3600             if (sflags & SVf_IVisUV)
3601                 SvIsUV_on(dstr);
3602             SvIV_set(dstr, SvIVX(sstr));
3603         }
3604         if (SvVOK(sstr)) {
3605             MAGIC *smg = mg_find(sstr,PERL_MAGIC_vstring);
3606             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3607                         smg->mg_ptr, smg->mg_len);
3608             SvRMAGICAL_on(dstr);
3609         }
3610     }
3611     else if (sflags & SVp_IOK) {
3612         if (sflags & SVf_IOK)
3613             (void)SvIOK_only(dstr);
3614         else {
3615             (void)SvOK_off(dstr);
3616             (void)SvIOKp_on(dstr);
3617         }
3618         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3619         if (sflags & SVf_IVisUV)
3620             SvIsUV_on(dstr);
3621         SvIV_set(dstr, SvIVX(sstr));
3622         if (sflags & SVp_NOK) {
3623             if (sflags & SVf_NOK)
3624                 (void)SvNOK_on(dstr);
3625             else
3626                 (void)SvNOKp_on(dstr);
3627             SvNV_set(dstr, SvNVX(sstr));
3628         }
3629     }
3630     else if (sflags & SVp_NOK) {
3631         if (sflags & SVf_NOK)
3632             (void)SvNOK_only(dstr);
3633         else {
3634             (void)SvOK_off(dstr);
3635             SvNOKp_on(dstr);
3636         }
3637         SvNV_set(dstr, SvNVX(sstr));
3638     }
3639     else {
3640         if (dtype == SVt_PVGV) {
3641             if (ckWARN(WARN_MISC))
3642                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3643         }
3644         else
3645             (void)SvOK_off(dstr);
3646     }
3647     if (SvTAINTED(sstr))
3648         SvTAINT(dstr);
3649 }
3650
3651 /*
3652 =for apidoc sv_setsv_mg
3653
3654 Like C<sv_setsv>, but also handles 'set' magic.
3655
3656 =cut
3657 */
3658
3659 void
3660 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3661 {
3662     sv_setsv(dstr,sstr);
3663     SvSETMAGIC(dstr);
3664 }
3665
3666 #ifdef PERL_OLD_COPY_ON_WRITE
3667 SV *
3668 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3669 {
3670     STRLEN cur = SvCUR(sstr);
3671     STRLEN len = SvLEN(sstr);
3672     register char *new_pv;
3673
3674     if (DEBUG_C_TEST) {
3675         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3676                       sstr, dstr);
3677         sv_dump(sstr);
3678         if (dstr)
3679                     sv_dump(dstr);
3680     }
3681
3682     if (dstr) {
3683         if (SvTHINKFIRST(dstr))
3684             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3685         else if (SvPVX_const(dstr))
3686             Safefree(SvPVX_const(dstr));
3687     }
3688     else
3689         new_SV(dstr);
3690     SvUPGRADE(dstr, SVt_PVIV);
3691
3692     assert (SvPOK(sstr));
3693     assert (SvPOKp(sstr));
3694     assert (!SvIOK(sstr));
3695     assert (!SvIOKp(sstr));
3696     assert (!SvNOK(sstr));
3697     assert (!SvNOKp(sstr));
3698
3699     if (SvIsCOW(sstr)) {
3700
3701         if (SvLEN(sstr) == 0) {
3702             /* source is a COW shared hash key.  */
3703             DEBUG_C(PerlIO_printf(Perl_debug_log,
3704                                   "Fast copy on write: Sharing hash\n"));
3705             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3706             goto common_exit;
3707         }
3708         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3709     } else {
3710         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3711         SvUPGRADE(sstr, SVt_PVIV);
3712         SvREADONLY_on(sstr);
3713         SvFAKE_on(sstr);
3714         DEBUG_C(PerlIO_printf(Perl_debug_log,
3715                               "Fast copy on write: Converting sstr to COW\n"));
3716         SV_COW_NEXT_SV_SET(dstr, sstr);
3717     }
3718     SV_COW_NEXT_SV_SET(sstr, dstr);
3719     new_pv = SvPVX_mutable(sstr);
3720
3721   common_exit:
3722     SvPV_set(dstr, new_pv);
3723     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3724     if (SvUTF8(sstr))
3725         SvUTF8_on(dstr);
3726     SvLEN_set(dstr, len);
3727     SvCUR_set(dstr, cur);
3728     if (DEBUG_C_TEST) {
3729         sv_dump(dstr);
3730     }
3731     return dstr;
3732 }
3733 #endif
3734
3735 /*
3736 =for apidoc sv_setpvn
3737
3738 Copies a string into an SV.  The C<len> parameter indicates the number of
3739 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3740 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3741
3742 =cut
3743 */
3744
3745 void
3746 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3747 {
3748     register char *dptr;
3749
3750     SV_CHECK_THINKFIRST_COW_DROP(sv);
3751     if (!ptr) {
3752         (void)SvOK_off(sv);
3753         return;
3754     }
3755     else {
3756         /* len is STRLEN which is unsigned, need to copy to signed */
3757         const IV iv = len;
3758         if (iv < 0)
3759             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3760     }
3761     SvUPGRADE(sv, SVt_PV);
3762
3763     dptr = SvGROW(sv, len + 1);
3764     Move(ptr,dptr,len,char);
3765     dptr[len] = '\0';
3766     SvCUR_set(sv, len);
3767     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3768     SvTAINT(sv);
3769 }
3770
3771 /*
3772 =for apidoc sv_setpvn_mg
3773
3774 Like C<sv_setpvn>, but also handles 'set' magic.
3775
3776 =cut
3777 */
3778
3779 void
3780 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3781 {
3782     sv_setpvn(sv,ptr,len);
3783     SvSETMAGIC(sv);
3784 }
3785
3786 /*
3787 =for apidoc sv_setpv
3788
3789 Copies a string into an SV.  The string must be null-terminated.  Does not
3790 handle 'set' magic.  See C<sv_setpv_mg>.
3791
3792 =cut
3793 */
3794
3795 void
3796 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3797 {
3798     register STRLEN len;
3799
3800     SV_CHECK_THINKFIRST_COW_DROP(sv);
3801     if (!ptr) {
3802         (void)SvOK_off(sv);
3803         return;
3804     }
3805     len = strlen(ptr);
3806     SvUPGRADE(sv, SVt_PV);
3807
3808     SvGROW(sv, len + 1);
3809     Move(ptr,SvPVX(sv),len+1,char);
3810     SvCUR_set(sv, len);
3811     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3812     SvTAINT(sv);
3813 }
3814
3815 /*
3816 =for apidoc sv_setpv_mg
3817
3818 Like C<sv_setpv>, but also handles 'set' magic.
3819
3820 =cut
3821 */
3822
3823 void
3824 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3825 {
3826     sv_setpv(sv,ptr);
3827     SvSETMAGIC(sv);
3828 }
3829
3830 /*
3831 =for apidoc sv_usepvn
3832
3833 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3834 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3835 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3836 string length, C<len>, must be supplied.  This function will realloc the
3837 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3838 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3839 See C<sv_usepvn_mg>.
3840
3841 =cut
3842 */
3843
3844 void
3845 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3846 {
3847     STRLEN allocate;
3848     SV_CHECK_THINKFIRST_COW_DROP(sv);
3849     SvUPGRADE(sv, SVt_PV);
3850     if (!ptr) {
3851         (void)SvOK_off(sv);
3852         return;
3853     }
3854     if (SvPVX_const(sv))
3855         SvPV_free(sv);
3856
3857     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3858     ptr = saferealloc (ptr, allocate);
3859     SvPV_set(sv, ptr);
3860     SvCUR_set(sv, len);
3861     SvLEN_set(sv, allocate);
3862     *SvEND(sv) = '\0';
3863     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3864     SvTAINT(sv);
3865 }
3866
3867 /*
3868 =for apidoc sv_usepvn_mg
3869
3870 Like C<sv_usepvn>, but also handles 'set' magic.
3871
3872 =cut
3873 */
3874
3875 void
3876 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3877 {
3878     sv_usepvn(sv,ptr,len);
3879     SvSETMAGIC(sv);
3880 }
3881
3882 #ifdef PERL_OLD_COPY_ON_WRITE
3883 /* Need to do this *after* making the SV normal, as we need the buffer
3884    pointer to remain valid until after we've copied it.  If we let go too early,
3885    another thread could invalidate it by unsharing last of the same hash key
3886    (which it can do by means other than releasing copy-on-write Svs)
3887    or by changing the other copy-on-write SVs in the loop.  */
3888 STATIC void
3889 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3890 {
3891     if (len) { /* this SV was SvIsCOW_normal(sv) */
3892          /* we need to find the SV pointing to us.  */
3893         SV * const current = SV_COW_NEXT_SV(after);
3894
3895         if (current == sv) {
3896             /* The SV we point to points back to us (there were only two of us
3897                in the loop.)
3898                Hence other SV is no longer copy on write either.  */
3899             SvFAKE_off(after);
3900             SvREADONLY_off(after);
3901         } else {
3902             /* We need to follow the pointers around the loop.  */
3903             SV *next;
3904             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3905                 assert (next);
3906                 current = next;
3907                  /* don't loop forever if the structure is bust, and we have
3908                     a pointer into a closed loop.  */
3909                 assert (current != after);
3910                 assert (SvPVX_const(current) == pvx);
3911             }
3912             /* Make the SV before us point to the SV after us.  */
3913             SV_COW_NEXT_SV_SET(current, after);
3914         }
3915     } else {
3916         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3917     }
3918 }
3919
3920 int
3921 Perl_sv_release_IVX(pTHX_ register SV *sv)
3922 {
3923     if (SvIsCOW(sv))
3924         sv_force_normal_flags(sv, 0);
3925     SvOOK_off(sv);
3926     return 0;
3927 }
3928 #endif
3929 /*
3930 =for apidoc sv_force_normal_flags
3931
3932 Undo various types of fakery on an SV: if the PV is a shared string, make
3933 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3934 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3935 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3936 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3937 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3938 set to some other value.) In addition, the C<flags> parameter gets passed to
3939 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3940 with flags set to 0.
3941
3942 =cut
3943 */
3944
3945 void
3946 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3947 {
3948 #ifdef PERL_OLD_COPY_ON_WRITE
3949     if (SvREADONLY(sv)) {
3950         /* At this point I believe I should acquire a global SV mutex.  */
3951         if (SvFAKE(sv)) {
3952             const char * const pvx = SvPVX_const(sv);
3953             const STRLEN len = SvLEN(sv);
3954             const STRLEN cur = SvCUR(sv);
3955             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3956             if (DEBUG_C_TEST) {
3957                 PerlIO_printf(Perl_debug_log,
3958                               "Copy on write: Force normal %ld\n",
3959                               (long) flags);
3960                 sv_dump(sv);
3961             }
3962             SvFAKE_off(sv);
3963             SvREADONLY_off(sv);
3964             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3965             SvPV_set(sv, (char*)0);
3966             SvLEN_set(sv, 0);
3967             if (flags & SV_COW_DROP_PV) {
3968                 /* OK, so we don't need to copy our buffer.  */
3969                 SvPOK_off(sv);
3970             } else {
3971                 SvGROW(sv, cur + 1);
3972                 Move(pvx,SvPVX(sv),cur,char);
3973                 SvCUR_set(sv, cur);
3974                 *SvEND(sv) = '\0';
3975             }
3976             sv_release_COW(sv, pvx, len, next);
3977             if (DEBUG_C_TEST) {
3978                 sv_dump(sv);
3979             }
3980         }
3981         else if (IN_PERL_RUNTIME)
3982             Perl_croak(aTHX_ PL_no_modify);
3983         /* At this point I believe that I can drop the global SV mutex.  */
3984     }
3985 #else
3986     if (SvREADONLY(sv)) {
3987         if (SvFAKE(sv)) {
3988             const char * const pvx = SvPVX_const(sv);
3989             const STRLEN len = SvCUR(sv);
3990             SvFAKE_off(sv);
3991             SvREADONLY_off(sv);
3992             SvPV_set(sv, Nullch);
3993             SvLEN_set(sv, 0);
3994             SvGROW(sv, len + 1);
3995             Move(pvx,SvPVX(sv),len,char);
3996             *SvEND(sv) = '\0';
3997             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3998         }
3999         else if (IN_PERL_RUNTIME)
4000             Perl_croak(aTHX_ PL_no_modify);
4001     }
4002 #endif
4003     if (SvROK(sv))
4004         sv_unref_flags(sv, flags);
4005     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
4006         sv_unglob(sv);
4007 }
4008
4009 /*
4010 =for apidoc sv_chop
4011
4012 Efficient removal of characters from the beginning of the string buffer.
4013 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
4014 the string buffer.  The C<ptr> becomes the first character of the adjusted
4015 string. Uses the "OOK hack".
4016 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
4017 refer to the same chunk of data.
4018
4019 =cut
4020 */
4021
4022 void
4023 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
4024 {
4025     register STRLEN delta;
4026     if (!ptr || !SvPOKp(sv))
4027         return;
4028     delta = ptr - SvPVX_const(sv);
4029     SV_CHECK_THINKFIRST(sv);
4030     if (SvTYPE(sv) < SVt_PVIV)
4031         sv_upgrade(sv,SVt_PVIV);
4032
4033     if (!SvOOK(sv)) {
4034         if (!SvLEN(sv)) { /* make copy of shared string */
4035             const char *pvx = SvPVX_const(sv);
4036             const STRLEN len = SvCUR(sv);
4037             SvGROW(sv, len + 1);
4038             Move(pvx,SvPVX(sv),len,char);
4039             *SvEND(sv) = '\0';
4040         }
4041         SvIV_set(sv, 0);
4042         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
4043            and we do that anyway inside the SvNIOK_off
4044         */
4045         SvFLAGS(sv) |= SVf_OOK;
4046     }
4047     SvNIOK_off(sv);
4048     SvLEN_set(sv, SvLEN(sv) - delta);
4049     SvCUR_set(sv, SvCUR(sv) - delta);
4050     SvPV_set(sv, SvPVX(sv) + delta);
4051     SvIV_set(sv, SvIVX(sv) + delta);
4052 }
4053
4054 /*
4055 =for apidoc sv_catpvn
4056
4057 Concatenates the string onto the end of the string which is in the SV.  The
4058 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4059 status set, then the bytes appended should be valid UTF-8.
4060 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
4061
4062 =for apidoc sv_catpvn_flags
4063
4064 Concatenates the string onto the end of the string which is in the SV.  The
4065 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
4066 status set, then the bytes appended should be valid UTF-8.
4067 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
4068 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
4069 in terms of this function.
4070
4071 =cut
4072 */
4073
4074 void
4075 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
4076 {
4077     STRLEN dlen;
4078     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
4079
4080     SvGROW(dsv, dlen + slen + 1);
4081     if (sstr == dstr)
4082         sstr = SvPVX_const(dsv);
4083     Move(sstr, SvPVX(dsv) + dlen, slen, char);
4084     SvCUR_set(dsv, SvCUR(dsv) + slen);
4085     *SvEND(dsv) = '\0';
4086     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
4087     SvTAINT(dsv);
4088     if (flags & SV_SMAGIC)
4089         SvSETMAGIC(dsv);
4090 }
4091
4092 /*
4093 =for apidoc sv_catsv
4094
4095 Concatenates the string from SV C<ssv> onto the end of the string in
4096 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
4097 not 'set' magic.  See C<sv_catsv_mg>.
4098
4099 =for apidoc sv_catsv_flags
4100
4101 Concatenates the string from SV C<ssv> onto the end of the string in
4102 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
4103 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
4104 and C<sv_catsv_nomg> are implemented in terms of this function.
4105
4106 =cut */
4107
4108 void
4109 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
4110 {
4111     const char *spv;
4112     STRLEN slen;
4113     if (ssv) {
4114         if ((spv = SvPV_const(ssv, slen))) {
4115             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
4116                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
4117                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
4118                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
4119                 dsv->sv_flags doesn't have that bit set.
4120                 Andy Dougherty  12 Oct 2001
4121             */
4122             const I32 sutf8 = DO_UTF8(ssv);
4123             I32 dutf8;
4124
4125             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
4126                 mg_get(dsv);
4127             dutf8 = DO_UTF8(dsv);
4128
4129             if (dutf8 != sutf8) {
4130                 if (dutf8) {
4131                     /* Not modifying source SV, so taking a temporary copy. */
4132                     SV* csv = sv_2mortal(newSVpvn(spv, slen));
4133
4134                     sv_utf8_upgrade(csv);
4135                     spv = SvPV_const(csv, slen);
4136                 }
4137                 else
4138                     sv_utf8_upgrade_nomg(dsv);
4139             }
4140             sv_catpvn_nomg(dsv, spv, slen);
4141         }
4142     }
4143     if (flags & SV_SMAGIC)
4144         SvSETMAGIC(dsv);
4145 }
4146
4147 /*
4148 =for apidoc sv_catpv
4149
4150 Concatenates the string onto the end of the string which is in the SV.
4151 If the SV has the UTF-8 status set, then the bytes appended should be
4152 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
4153
4154 =cut */
4155
4156 void
4157 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
4158 {
4159     register STRLEN len;
4160     STRLEN tlen;
4161     char *junk;
4162
4163     if (!ptr)
4164         return;
4165     junk = SvPV_force(sv, tlen);
4166     len = strlen(ptr);
4167     SvGROW(sv, tlen + len + 1);
4168     if (ptr == junk)
4169         ptr = SvPVX_const(sv);
4170     Move(ptr,SvPVX(sv)+tlen,len+1,char);
4171     SvCUR_set(sv, SvCUR(sv) + len);
4172     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
4173     SvTAINT(sv);
4174 }
4175
4176 /*
4177 =for apidoc sv_catpv_mg
4178
4179 Like C<sv_catpv>, but also handles 'set' magic.
4180
4181 =cut
4182 */
4183
4184 void
4185 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
4186 {
4187     sv_catpv(sv,ptr);
4188     SvSETMAGIC(sv);
4189 }
4190
4191 /*
4192 =for apidoc newSV
4193
4194 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
4195 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
4196 macro.
4197
4198 =cut
4199 */
4200
4201 SV *
4202 Perl_newSV(pTHX_ STRLEN len)
4203 {
4204     register SV *sv;
4205
4206     new_SV(sv);
4207     if (len) {
4208         sv_upgrade(sv, SVt_PV);
4209         SvGROW(sv, len + 1);
4210     }
4211     return sv;
4212 }
4213 /*
4214 =for apidoc sv_magicext
4215
4216 Adds magic to an SV, upgrading it if necessary. Applies the
4217 supplied vtable and returns a pointer to the magic added.
4218
4219 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4220 In particular, you can add magic to SvREADONLY SVs, and add more than
4221 one instance of the same 'how'.
4222
4223 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4224 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4225 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4226 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4227
4228 (This is now used as a subroutine by C<sv_magic>.)
4229
4230 =cut
4231 */
4232 MAGIC * 
4233 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4234                  const char* name, I32 namlen)
4235 {
4236     MAGIC* mg;
4237
4238     if (SvTYPE(sv) < SVt_PVMG) {
4239         SvUPGRADE(sv, SVt_PVMG);
4240     }
4241     Newxz(mg, 1, MAGIC);
4242     mg->mg_moremagic = SvMAGIC(sv);
4243     SvMAGIC_set(sv, mg);
4244
4245     /* Sometimes a magic contains a reference loop, where the sv and
4246        object refer to each other.  To prevent a reference loop that
4247        would prevent such objects being freed, we look for such loops
4248        and if we find one we avoid incrementing the object refcount.
4249
4250        Note we cannot do this to avoid self-tie loops as intervening RV must
4251        have its REFCNT incremented to keep it in existence.
4252
4253     */
4254     if (!obj || obj == sv ||
4255         how == PERL_MAGIC_arylen ||
4256         how == PERL_MAGIC_qr ||
4257         how == PERL_MAGIC_symtab ||
4258         (SvTYPE(obj) == SVt_PVGV &&
4259             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4260             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4261             GvFORM(obj) == (CV*)sv)))
4262     {
4263         mg->mg_obj = obj;
4264     }
4265     else {
4266         mg->mg_obj = SvREFCNT_inc(obj);
4267         mg->mg_flags |= MGf_REFCOUNTED;
4268     }
4269
4270     /* Normal self-ties simply pass a null object, and instead of
4271        using mg_obj directly, use the SvTIED_obj macro to produce a
4272        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4273        with an RV obj pointing to the glob containing the PVIO.  In
4274        this case, to avoid a reference loop, we need to weaken the
4275        reference.
4276     */
4277
4278     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4279         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4280     {
4281       sv_rvweaken(obj);
4282     }
4283
4284     mg->mg_type = how;
4285     mg->mg_len = namlen;
4286     if (name) {
4287         if (namlen > 0)
4288             mg->mg_ptr = savepvn(name, namlen);
4289         else if (namlen == HEf_SVKEY)
4290             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4291         else
4292             mg->mg_ptr = (char *) name;
4293     }
4294     mg->mg_virtual = vtable;
4295
4296     mg_magical(sv);
4297     if (SvGMAGICAL(sv))
4298         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4299     return mg;
4300 }
4301
4302 /*
4303 =for apidoc sv_magic
4304
4305 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4306 then adds a new magic item of type C<how> to the head of the magic list.
4307
4308 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4309 handling of the C<name> and C<namlen> arguments.
4310
4311 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4312 to add more than one instance of the same 'how'.
4313
4314 =cut
4315 */
4316
4317 void
4318 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4319 {
4320     const MGVTBL *vtable;
4321     MAGIC* mg;
4322
4323 #ifdef PERL_OLD_COPY_ON_WRITE
4324     if (SvIsCOW(sv))
4325         sv_force_normal_flags(sv, 0);
4326 #endif
4327     if (SvREADONLY(sv)) {
4328         if (
4329             /* its okay to attach magic to shared strings; the subsequent
4330              * upgrade to PVMG will unshare the string */
4331             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4332
4333             && IN_PERL_RUNTIME
4334             && how != PERL_MAGIC_regex_global
4335             && how != PERL_MAGIC_bm
4336             && how != PERL_MAGIC_fm
4337             && how != PERL_MAGIC_sv
4338             && how != PERL_MAGIC_backref
4339            )
4340         {
4341             Perl_croak(aTHX_ PL_no_modify);
4342         }
4343     }
4344     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4345         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4346             /* sv_magic() refuses to add a magic of the same 'how' as an
4347                existing one
4348              */
4349             if (how == PERL_MAGIC_taint)
4350                 mg->mg_len |= 1;
4351             return;
4352         }
4353     }
4354
4355     switch (how) {
4356     case PERL_MAGIC_sv:
4357         vtable = &PL_vtbl_sv;
4358         break;
4359     case PERL_MAGIC_overload:
4360         vtable = &PL_vtbl_amagic;
4361         break;
4362     case PERL_MAGIC_overload_elem:
4363         vtable = &PL_vtbl_amagicelem;
4364         break;
4365     case PERL_MAGIC_overload_table:
4366         vtable = &PL_vtbl_ovrld;
4367         break;
4368     case PERL_MAGIC_bm:
4369         vtable = &PL_vtbl_bm;
4370         break;
4371     case PERL_MAGIC_regdata:
4372         vtable = &PL_vtbl_regdata;
4373         break;
4374     case PERL_MAGIC_regdatum:
4375         vtable = &PL_vtbl_regdatum;
4376         break;
4377     case PERL_MAGIC_env:
4378         vtable = &PL_vtbl_env;
4379         break;
4380     case PERL_MAGIC_fm:
4381         vtable = &PL_vtbl_fm;
4382         break;
4383     case PERL_MAGIC_envelem:
4384         vtable = &PL_vtbl_envelem;
4385         break;
4386     case PERL_MAGIC_regex_global:
4387         vtable = &PL_vtbl_mglob;
4388         break;
4389     case PERL_MAGIC_isa:
4390         vtable = &PL_vtbl_isa;
4391         break;
4392     case PERL_MAGIC_isaelem:
4393         vtable = &PL_vtbl_isaelem;
4394         break;
4395     case PERL_MAGIC_nkeys:
4396         vtable = &PL_vtbl_nkeys;
4397         break;
4398     case PERL_MAGIC_dbfile:
4399         vtable = NULL;
4400         break;
4401     case PERL_MAGIC_dbline:
4402         vtable = &PL_vtbl_dbline;
4403         break;
4404 #ifdef USE_LOCALE_COLLATE
4405     case PERL_MAGIC_collxfrm:
4406         vtable = &PL_vtbl_collxfrm;
4407         break;
4408 #endif /* USE_LOCALE_COLLATE */
4409     case PERL_MAGIC_tied:
4410         vtable = &PL_vtbl_pack;
4411         break;
4412     case PERL_MAGIC_tiedelem:
4413     case PERL_MAGIC_tiedscalar:
4414         vtable = &PL_vtbl_packelem;
4415         break;
4416     case PERL_MAGIC_qr:
4417         vtable = &PL_vtbl_regexp;
4418         break;
4419     case PERL_MAGIC_sig:
4420         vtable = &PL_vtbl_sig;
4421         break;
4422     case PERL_MAGIC_sigelem:
4423         vtable = &PL_vtbl_sigelem;
4424         break;
4425     case PERL_MAGIC_taint:
4426         vtable = &PL_vtbl_taint;
4427         break;
4428     case PERL_MAGIC_uvar:
4429         vtable = &PL_vtbl_uvar;
4430         break;
4431     case PERL_MAGIC_vec:
4432         vtable = &PL_vtbl_vec;
4433         break;
4434     case PERL_MAGIC_arylen_p:
4435     case PERL_MAGIC_rhash:
4436     case PERL_MAGIC_symtab:
4437     case PERL_MAGIC_vstring:
4438         vtable = NULL;
4439         break;
4440     case PERL_MAGIC_utf8:
4441         vtable = &PL_vtbl_utf8;
4442         break;
4443     case PERL_MAGIC_substr:
4444         vtable = &PL_vtbl_substr;
4445         break;
4446     case PERL_MAGIC_defelem:
4447         vtable = &PL_vtbl_defelem;
4448         break;
4449     case PERL_MAGIC_glob:
4450         vtable = &PL_vtbl_glob;
4451         break;
4452     case PERL_MAGIC_arylen:
4453         vtable = &PL_vtbl_arylen;
4454         break;
4455     case PERL_MAGIC_pos:
4456         vtable = &PL_vtbl_pos;
4457         break;
4458     case PERL_MAGIC_backref:
4459         vtable = &PL_vtbl_backref;
4460         break;
4461     case PERL_MAGIC_ext:
4462         /* Reserved for use by extensions not perl internals.           */
4463         /* Useful for attaching extension internal data to perl vars.   */
4464         /* Note that multiple extensions may clash if magical scalars   */
4465         /* etc holding private data from one are passed to another.     */
4466         vtable = NULL;
4467         break;
4468     default:
4469         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4470     }
4471
4472     /* Rest of work is done else where */
4473     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4474
4475     switch (how) {
4476     case PERL_MAGIC_taint:
4477         mg->mg_len = 1;
4478         break;
4479     case PERL_MAGIC_ext:
4480     case PERL_MAGIC_dbfile:
4481         SvRMAGICAL_on(sv);
4482         break;
4483     }
4484 }
4485
4486 /*
4487 =for apidoc sv_unmagic
4488
4489 Removes all magic of type C<type> from an SV.
4490
4491 =cut
4492 */
4493
4494 int
4495 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4496 {
4497     MAGIC* mg;
4498     MAGIC** mgp;
4499     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4500         return 0;
4501     mgp = &SvMAGIC(sv);
4502     for (mg = *mgp; mg; mg = *mgp) {
4503         if (mg->mg_type == type) {
4504             const MGVTBL* const vtbl = mg->mg_virtual;
4505             *mgp = mg->mg_moremagic;
4506             if (vtbl && vtbl->svt_free)
4507                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4508             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4509                 if (mg->mg_len > 0)
4510                     Safefree(mg->mg_ptr);
4511                 else if (mg->mg_len == HEf_SVKEY)
4512                     SvREFCNT_dec((SV*)mg->mg_ptr);
4513                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4514                     Safefree(mg->mg_ptr);
4515             }
4516             if (mg->mg_flags & MGf_REFCOUNTED)
4517                 SvREFCNT_dec(mg->mg_obj);
4518             Safefree(mg);
4519         }
4520         else
4521             mgp = &mg->mg_moremagic;
4522     }
4523     if (!SvMAGIC(sv)) {
4524         SvMAGICAL_off(sv);
4525        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4526     }
4527
4528     return 0;
4529 }
4530
4531 /*
4532 =for apidoc sv_rvweaken
4533
4534 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4535 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4536 push a back-reference to this RV onto the array of backreferences
4537 associated with that magic.
4538
4539 =cut
4540 */
4541
4542 SV *
4543 Perl_sv_rvweaken(pTHX_ SV *sv)
4544 {
4545     SV *tsv;
4546     if (!SvOK(sv))  /* let undefs pass */
4547         return sv;
4548     if (!SvROK(sv))
4549         Perl_croak(aTHX_ "Can't weaken a nonreference");
4550     else if (SvWEAKREF(sv)) {
4551         if (ckWARN(WARN_MISC))
4552             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4553         return sv;
4554     }
4555     tsv = SvRV(sv);
4556     Perl_sv_add_backref(aTHX_ tsv, sv);
4557     SvWEAKREF_on(sv);
4558     SvREFCNT_dec(tsv);
4559     return sv;
4560 }
4561
4562 /* Give tsv backref magic if it hasn't already got it, then push a
4563  * back-reference to sv onto the array associated with the backref magic.
4564  */
4565
4566 void
4567 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4568 {
4569     AV *av;
4570     MAGIC *mg;
4571     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4572         av = (AV*)mg->mg_obj;
4573     else {
4574         av = newAV();
4575         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4576         /* av now has a refcnt of 2, which avoids it getting freed
4577          * before us during global cleanup. The extra ref is removed
4578          * by magic_killbackrefs() when tsv is being freed */
4579     }
4580     if (AvFILLp(av) >= AvMAX(av)) {
4581         av_extend(av, AvFILLp(av)+1);
4582     }
4583     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4584 }
4585
4586 /* delete a back-reference to ourselves from the backref magic associated
4587  * with the SV we point to.
4588  */
4589
4590 STATIC void
4591 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4592 {
4593     AV *av;
4594     SV **svp;
4595     I32 i;
4596     MAGIC *mg = NULL;
4597     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4598         if (PL_in_clean_all)
4599             return;
4600     }
4601     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4602         Perl_croak(aTHX_ "panic: del_backref");
4603     av = (AV *)mg->mg_obj;
4604     svp = AvARRAY(av);
4605     /* We shouldn't be in here more than once, but for paranoia reasons lets
4606        not assume this.  */
4607     for (i = AvFILLp(av); i >= 0; i--) {
4608         if (svp[i] == sv) {
4609             const SSize_t fill = AvFILLp(av);
4610             if (i != fill) {
4611                 /* We weren't the last entry.
4612                    An unordered list has this property that you can take the
4613                    last element off the end to fill the hole, and it's still
4614                    an unordered list :-)
4615                 */
4616                 svp[i] = svp[fill];
4617             }
4618             svp[fill] = Nullsv;
4619             AvFILLp(av) = fill - 1;
4620         }
4621     }
4622 }
4623
4624 /*
4625 =for apidoc sv_insert
4626
4627 Inserts a string at the specified offset/length within the SV. Similar to
4628 the Perl substr() function.
4629
4630 =cut
4631 */
4632
4633 void
4634 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4635 {
4636     register char *big;
4637     register char *mid;
4638     register char *midend;
4639     register char *bigend;
4640     register I32 i;
4641     STRLEN curlen;
4642
4643
4644     if (!bigstr)
4645         Perl_croak(aTHX_ "Can't modify non-existent substring");
4646     SvPV_force(bigstr, curlen);
4647     (void)SvPOK_only_UTF8(bigstr);
4648     if (offset + len > curlen) {
4649         SvGROW(bigstr, offset+len+1);
4650         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4651         SvCUR_set(bigstr, offset+len);
4652     }
4653
4654     SvTAINT(bigstr);
4655     i = littlelen - len;
4656     if (i > 0) {                        /* string might grow */
4657         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4658         mid = big + offset + len;
4659         midend = bigend = big + SvCUR(bigstr);
4660         bigend += i;
4661         *bigend = '\0';
4662         while (midend > mid)            /* shove everything down */
4663             *--bigend = *--midend;
4664         Move(little,big+offset,littlelen,char);
4665         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4666         SvSETMAGIC(bigstr);
4667         return;
4668     }
4669     else if (i == 0) {
4670         Move(little,SvPVX(bigstr)+offset,len,char);
4671         SvSETMAGIC(bigstr);
4672         return;
4673     }
4674
4675     big = SvPVX(bigstr);
4676     mid = big + offset;
4677     midend = mid + len;
4678     bigend = big + SvCUR(bigstr);
4679
4680     if (midend > bigend)
4681         Perl_croak(aTHX_ "panic: sv_insert");
4682
4683     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4684         if (littlelen) {
4685             Move(little, mid, littlelen,char);
4686             mid += littlelen;
4687         }
4688         i = bigend - midend;
4689         if (i > 0) {
4690             Move(midend, mid, i,char);
4691             mid += i;
4692         }
4693         *mid = '\0';
4694         SvCUR_set(bigstr, mid - big);
4695     }
4696     else if ((i = mid - big)) { /* faster from front */
4697         midend -= littlelen;
4698         mid = midend;
4699         sv_chop(bigstr,midend-i);
4700         big += i;
4701         while (i--)
4702             *--midend = *--big;
4703         if (littlelen)
4704             Move(little, mid, littlelen,char);
4705     }
4706     else if (littlelen) {
4707         midend -= littlelen;
4708         sv_chop(bigstr,midend);
4709         Move(little,midend,littlelen,char);
4710     }
4711     else {
4712         sv_chop(bigstr,midend);
4713     }
4714     SvSETMAGIC(bigstr);
4715 }
4716
4717 /*
4718 =for apidoc sv_replace
4719
4720 Make the first argument a copy of the second, then delete the original.
4721 The target SV physically takes over ownership of the body of the source SV
4722 and inherits its flags; however, the target keeps any magic it owns,
4723 and any magic in the source is discarded.
4724 Note that this is a rather specialist SV copying operation; most of the
4725 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4726
4727 =cut
4728 */
4729
4730 void
4731 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4732 {
4733     const U32 refcnt = SvREFCNT(sv);
4734     SV_CHECK_THINKFIRST_COW_DROP(sv);
4735     if (SvREFCNT(nsv) != 1) {
4736         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4737                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4738     }
4739     if (SvMAGICAL(sv)) {
4740         if (SvMAGICAL(nsv))
4741             mg_free(nsv);
4742         else
4743             sv_upgrade(nsv, SVt_PVMG);
4744         SvMAGIC_set(nsv, SvMAGIC(sv));
4745         SvFLAGS(nsv) |= SvMAGICAL(sv);
4746         SvMAGICAL_off(sv);
4747         SvMAGIC_set(sv, NULL);
4748     }
4749     SvREFCNT(sv) = 0;
4750     sv_clear(sv);
4751     assert(!SvREFCNT(sv));
4752 #ifdef DEBUG_LEAKING_SCALARS
4753     sv->sv_flags  = nsv->sv_flags;
4754     sv->sv_any    = nsv->sv_any;
4755     sv->sv_refcnt = nsv->sv_refcnt;
4756     sv->sv_u      = nsv->sv_u;
4757 #else
4758     StructCopy(nsv,sv,SV);
4759 #endif
4760     /* Currently could join these into one piece of pointer arithmetic, but
4761        it would be unclear.  */
4762     if(SvTYPE(sv) == SVt_IV)
4763         SvANY(sv)
4764             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4765     else if (SvTYPE(sv) == SVt_RV) {
4766         SvANY(sv) = &sv->sv_u.svu_rv;
4767     }
4768         
4769
4770 #ifdef PERL_OLD_COPY_ON_WRITE
4771     if (SvIsCOW_normal(nsv)) {
4772         /* We need to follow the pointers around the loop to make the
4773            previous SV point to sv, rather than nsv.  */
4774         SV *next;
4775         SV *current = nsv;
4776         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4777             assert(next);
4778             current = next;
4779             assert(SvPVX_const(current) == SvPVX_const(nsv));
4780         }
4781         /* Make the SV before us point to the SV after us.  */
4782         if (DEBUG_C_TEST) {
4783             PerlIO_printf(Perl_debug_log, "previous is\n");
4784             sv_dump(current);
4785             PerlIO_printf(Perl_debug_log,
4786                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4787                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4788         }
4789         SV_COW_NEXT_SV_SET(current, sv);
4790     }
4791 #endif
4792     SvREFCNT(sv) = refcnt;
4793     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4794     SvREFCNT(nsv) = 0;
4795     del_SV(nsv);
4796 }
4797
4798 /*
4799 =for apidoc sv_clear
4800
4801 Clear an SV: call any destructors, free up any memory used by the body,
4802 and free the body itself. The SV's head is I<not> freed, although
4803 its type is set to all 1's so that it won't inadvertently be assumed
4804 to be live during global destruction etc.
4805 This function should only be called when REFCNT is zero. Most of the time
4806 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4807 instead.
4808
4809 =cut
4810 */
4811
4812 void
4813 Perl_sv_clear(pTHX_ register SV *sv)
4814 {
4815     dVAR;
4816     const U32 type = SvTYPE(sv);
4817     const struct body_details *const sv_type_details
4818         = bodies_by_type + type;
4819
4820     assert(sv);
4821     assert(SvREFCNT(sv) == 0);
4822
4823     if (type <= SVt_IV)
4824         return;
4825
4826     if (SvOBJECT(sv)) {
4827         if (PL_defstash) {              /* Still have a symbol table? */
4828             dSP;
4829             HV* stash;
4830             do {        
4831                 CV* destructor;
4832                 stash = SvSTASH(sv);
4833                 destructor = StashHANDLER(stash,DESTROY);
4834                 if (destructor) {
4835                     SV* const tmpref = newRV(sv);
4836                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4837                     ENTER;
4838                     PUSHSTACKi(PERLSI_DESTROY);
4839                     EXTEND(SP, 2);
4840                     PUSHMARK(SP);
4841                     PUSHs(tmpref);
4842                     PUTBACK;
4843                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4844                 
4845                 
4846                     POPSTACK;
4847                     SPAGAIN;
4848                     LEAVE;
4849                     if(SvREFCNT(tmpref) < 2) {
4850                         /* tmpref is not kept alive! */
4851                         SvREFCNT(sv)--;
4852                         SvRV_set(tmpref, NULL);
4853                         SvROK_off(tmpref);
4854                     }
4855                     SvREFCNT_dec(tmpref);
4856                 }
4857             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4858
4859
4860             if (SvREFCNT(sv)) {
4861                 if (PL_in_clean_objs)
4862                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4863                           HvNAME_get(stash));
4864                 /* DESTROY gave object new lease on life */
4865                 return;
4866             }
4867         }
4868
4869         if (SvOBJECT(sv)) {
4870             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4871             SvOBJECT_off(sv);   /* Curse the object. */
4872             if (type != SVt_PVIO)
4873                 --PL_sv_objcount;       /* XXX Might want something more general */
4874         }
4875     }
4876     if (type >= SVt_PVMG) {
4877         if (SvMAGIC(sv))
4878             mg_free(sv);
4879         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4880             SvREFCNT_dec(SvSTASH(sv));
4881     }
4882     switch (type) {
4883     case SVt_PVIO:
4884         if (IoIFP(sv) &&
4885             IoIFP(sv) != PerlIO_stdin() &&
4886             IoIFP(sv) != PerlIO_stdout() &&
4887             IoIFP(sv) != PerlIO_stderr())
4888         {
4889             io_close((IO*)sv, FALSE);
4890         }
4891         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4892             PerlDir_close(IoDIRP(sv));
4893         IoDIRP(sv) = (DIR*)NULL;
4894         Safefree(IoTOP_NAME(sv));
4895         Safefree(IoFMT_NAME(sv));
4896         Safefree(IoBOTTOM_NAME(sv));
4897         goto freescalar;
4898     case SVt_PVBM:
4899         goto freescalar;
4900     case SVt_PVCV:
4901     case SVt_PVFM:
4902         cv_undef((CV*)sv);
4903         goto freescalar;
4904     case SVt_PVHV:
4905         hv_undef((HV*)sv);
4906         break;
4907     case SVt_PVAV:
4908         av_undef((AV*)sv);
4909         break;
4910     case SVt_PVLV:
4911         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4912             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4913             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4914             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4915         }
4916         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4917             SvREFCNT_dec(LvTARG(sv));
4918         goto freescalar;
4919     case SVt_PVGV:
4920         gp_free((GV*)sv);
4921         Safefree(GvNAME(sv));
4922         /* If we're in a stash, we don't own a reference to it. However it does
4923            have a back reference to us, which needs to be cleared.  */
4924         if (GvSTASH(sv))
4925             sv_del_backref((SV*)GvSTASH(sv), sv);
4926     case SVt_PVMG:
4927     case SVt_PVNV:
4928     case SVt_PVIV:
4929       freescalar:
4930         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4931         if (SvOOK(sv)) {
4932             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4933             /* Don't even bother with turning off the OOK flag.  */
4934         }
4935     case SVt_PV:
4936     case SVt_RV:
4937         if (SvROK(sv)) {
4938             SV *target = SvRV(sv);
4939             if (SvWEAKREF(sv))
4940                 sv_del_backref(target, sv);
4941             else
4942                 SvREFCNT_dec(target);
4943         }
4944 #ifdef PERL_OLD_COPY_ON_WRITE
4945         else if (SvPVX_const(sv)) {
4946             if (SvIsCOW(sv)) {
4947                 /* I believe I need to grab the global SV mutex here and
4948                    then recheck the COW status.  */
4949                 if (DEBUG_C_TEST) {
4950                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4951                     sv_dump(sv);
4952                 }
4953                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4954                                SV_COW_NEXT_SV(sv));
4955                 /* And drop it here.  */
4956                 SvFAKE_off(sv);
4957             } else if (SvLEN(sv)) {
4958                 Safefree(SvPVX_const(sv));
4959             }
4960         }
4961 #else
4962         else if (SvPVX_const(sv) && SvLEN(sv))
4963             Safefree(SvPVX_mutable(sv));
4964         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4965             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4966             SvFAKE_off(sv);
4967         }
4968 #endif
4969         break;
4970     case SVt_NV:
4971         break;
4972     }
4973
4974     SvFLAGS(sv) &= SVf_BREAK;
4975     SvFLAGS(sv) |= SVTYPEMASK;
4976
4977     if (sv_type_details->arena) {
4978         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4979                  &PL_body_roots[type]);
4980     }
4981     else if (sv_type_details->size) {
4982         my_safefree(SvANY(sv));
4983     }
4984 }
4985
4986 /*
4987 =for apidoc sv_newref
4988
4989 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
4990 instead.
4991
4992 =cut
4993 */
4994
4995 SV *
4996 Perl_sv_newref(pTHX_ SV *sv)
4997 {
4998     if (sv)
4999         (SvREFCNT(sv))++;
5000     return sv;
5001 }
5002
5003 /*
5004 =for apidoc sv_free
5005
5006 Decrement an SV's reference count, and if it drops to zero, call
5007 C<sv_clear> to invoke destructors and free up any memory used by
5008 the body; finally, deallocate the SV's head itself.
5009 Normally called via a wrapper macro C<SvREFCNT_dec>.
5010
5011 =cut
5012 */
5013
5014 void
5015 Perl_sv_free(pTHX_ SV *sv)
5016 {
5017     dVAR;
5018     if (!sv)
5019         return;
5020     if (SvREFCNT(sv) == 0) {
5021         if (SvFLAGS(sv) & SVf_BREAK)
5022             /* this SV's refcnt has been artificially decremented to
5023              * trigger cleanup */
5024             return;
5025         if (PL_in_clean_all) /* All is fair */
5026             return;
5027         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5028             /* make sure SvREFCNT(sv)==0 happens very seldom */
5029             SvREFCNT(sv) = (~(U32)0)/2;
5030             return;
5031         }
5032         if (ckWARN_d(WARN_INTERNAL)) {
5033             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
5034                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
5035                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5036 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
5037             Perl_dump_sv_child(aTHX_ sv);
5038 #endif
5039         }
5040         return;
5041     }
5042     if (--(SvREFCNT(sv)) > 0)
5043         return;
5044     Perl_sv_free2(aTHX_ sv);
5045 }
5046
5047 void
5048 Perl_sv_free2(pTHX_ SV *sv)
5049 {
5050     dVAR;
5051 #ifdef DEBUGGING
5052     if (SvTEMP(sv)) {
5053         if (ckWARN_d(WARN_DEBUGGING))
5054             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
5055                         "Attempt to free temp prematurely: SV 0x%"UVxf
5056                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
5057         return;
5058     }
5059 #endif
5060     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
5061         /* make sure SvREFCNT(sv)==0 happens very seldom */
5062         SvREFCNT(sv) = (~(U32)0)/2;
5063         return;
5064     }
5065     sv_clear(sv);
5066     if (! SvREFCNT(sv))
5067         del_SV(sv);
5068 }
5069
5070 /*
5071 =for apidoc sv_len
5072
5073 Returns the length of the string in the SV. Handles magic and type
5074 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
5075
5076 =cut
5077 */
5078
5079 STRLEN
5080 Perl_sv_len(pTHX_ register SV *sv)
5081 {
5082     STRLEN len;
5083
5084     if (!sv)
5085         return 0;
5086
5087     if (SvGMAGICAL(sv))
5088         len = mg_length(sv);
5089     else
5090         (void)SvPV_const(sv, len);
5091     return len;
5092 }
5093
5094 /*
5095 =for apidoc sv_len_utf8
5096
5097 Returns the number of characters in the string in an SV, counting wide
5098 UTF-8 bytes as a single character. Handles magic and type coercion.
5099
5100 =cut
5101 */
5102
5103 /*
5104  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
5105  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
5106  * (Note that the mg_len is not the length of the mg_ptr field.)
5107  *
5108  */
5109
5110 STRLEN
5111 Perl_sv_len_utf8(pTHX_ register SV *sv)
5112 {
5113     if (!sv)
5114         return 0;
5115
5116     if (SvGMAGICAL(sv))
5117         return mg_length(sv);
5118     else
5119     {
5120         STRLEN len, ulen;
5121         const U8 *s = (U8*)SvPV_const(sv, len);
5122         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
5123
5124         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
5125             ulen = mg->mg_len;
5126 #ifdef PERL_UTF8_CACHE_ASSERT
5127             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
5128 #endif
5129         }
5130         else {
5131             ulen = Perl_utf8_length(aTHX_ s, s + len);
5132             if (!mg && !SvREADONLY(sv)) {
5133                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5134                 mg = mg_find(sv, PERL_MAGIC_utf8);
5135                 assert(mg);
5136             }
5137             if (mg)
5138                 mg->mg_len = ulen;
5139         }
5140         return ulen;
5141     }
5142 }
5143
5144 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
5145  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5146  * between UTF-8 and byte offsets.  There are two (substr offset and substr
5147  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
5148  * and byte offset) cache positions.
5149  *
5150  * The mg_len field is used by sv_len_utf8(), see its comments.
5151  * Note that the mg_len is not the length of the mg_ptr field.
5152  *
5153  */
5154 STATIC bool
5155 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
5156                    I32 offsetp, const U8 *s, const U8 *start)
5157 {
5158     bool found = FALSE;
5159
5160     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5161         if (!*mgp)
5162             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
5163         assert(*mgp);
5164
5165         if ((*mgp)->mg_ptr)
5166             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5167         else {
5168             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5169             (*mgp)->mg_ptr = (char *) *cachep;
5170         }
5171         assert(*cachep);
5172
5173         (*cachep)[i]   = offsetp;
5174         (*cachep)[i+1] = s - start;
5175         found = TRUE;
5176     }
5177
5178     return found;
5179 }
5180
5181 /*
5182  * S_utf8_mg_pos() is used to query and update mg_ptr field of
5183  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5184  * between UTF-8 and byte offsets.  See also the comments of
5185  * S_utf8_mg_pos_init().
5186  *
5187  */
5188 STATIC bool
5189 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
5190 {
5191     bool found = FALSE;
5192
5193     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5194         if (!*mgp)
5195             *mgp = mg_find(sv, PERL_MAGIC_utf8);
5196         if (*mgp && (*mgp)->mg_ptr) {
5197             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5198             ASSERT_UTF8_CACHE(*cachep);
5199             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
5200                  found = TRUE;
5201             else {                      /* We will skip to the right spot. */
5202                  STRLEN forw  = 0;
5203                  STRLEN backw = 0;
5204                  const U8* p = NULL;
5205
5206                  /* The assumption is that going backward is half
5207                   * the speed of going forward (that's where the
5208                   * 2 * backw in the below comes from).  (The real
5209                   * figure of course depends on the UTF-8 data.) */
5210
5211                  if ((*cachep)[i] > (STRLEN)uoff) {
5212                       forw  = uoff;
5213                       backw = (*cachep)[i] - (STRLEN)uoff;
5214
5215                       if (forw < 2 * backw)
5216                            p = start;
5217                       else
5218                            p = start + (*cachep)[i+1];
5219                  }
5220                  /* Try this only for the substr offset (i == 0),
5221                   * not for the substr length (i == 2). */
5222                  else if (i == 0) { /* (*cachep)[i] < uoff */
5223                       const STRLEN ulen = sv_len_utf8(sv);
5224
5225                       if ((STRLEN)uoff < ulen) {
5226                            forw  = (STRLEN)uoff - (*cachep)[i];
5227                            backw = ulen - (STRLEN)uoff;
5228
5229                            if (forw < 2 * backw)
5230                                 p = start + (*cachep)[i+1];
5231                            else
5232                                 p = send;
5233                       }
5234
5235                       /* If the string is not long enough for uoff,
5236                        * we could extend it, but not at this low a level. */
5237                  }
5238
5239                  if (p) {
5240                       if (forw < 2 * backw) {
5241                            while (forw--)
5242                                 p += UTF8SKIP(p);
5243                       }
5244                       else {
5245                            while (backw--) {
5246                                 p--;
5247                                 while (UTF8_IS_CONTINUATION(*p))
5248                                      p--;
5249                            }
5250                       }
5251
5252                       /* Update the cache. */
5253                       (*cachep)[i]   = (STRLEN)uoff;
5254                       (*cachep)[i+1] = p - start;
5255
5256                       /* Drop the stale "length" cache */
5257                       if (i == 0) {
5258                           (*cachep)[2] = 0;
5259                           (*cachep)[3] = 0;
5260                       }
5261
5262                       found = TRUE;
5263                  }
5264             }
5265             if (found) {        /* Setup the return values. */
5266                  *offsetp = (*cachep)[i+1];
5267                  *sp = start + *offsetp;
5268                  if (*sp >= send) {
5269                       *sp = send;
5270                       *offsetp = send - start;
5271                  }
5272                  else if (*sp < start) {
5273                       *sp = start;
5274                       *offsetp = 0;
5275                  }
5276             }
5277         }
5278 #ifdef PERL_UTF8_CACHE_ASSERT
5279         if (found) {
5280              U8 *s = start;
5281              I32 n = uoff;
5282
5283              while (n-- && s < send)
5284                   s += UTF8SKIP(s);
5285
5286              if (i == 0) {
5287                   assert(*offsetp == s - start);
5288                   assert((*cachep)[0] == (STRLEN)uoff);
5289                   assert((*cachep)[1] == *offsetp);
5290              }
5291              ASSERT_UTF8_CACHE(*cachep);
5292         }
5293 #endif
5294     }
5295
5296     return found;
5297 }
5298
5299 /*
5300 =for apidoc sv_pos_u2b
5301
5302 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5303 the start of the string, to a count of the equivalent number of bytes; if
5304 lenp is non-zero, it does the same to lenp, but this time starting from
5305 the offset, rather than from the start of the string. Handles magic and
5306 type coercion.
5307
5308 =cut
5309 */
5310
5311 /*
5312  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5313  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5314  * byte offsets.  See also the comments of S_utf8_mg_pos().
5315  *
5316  */
5317
5318 void
5319 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5320 {
5321     const U8 *start;
5322     STRLEN len;
5323
5324     if (!sv)
5325         return;
5326
5327     start = (U8*)SvPV_const(sv, len);
5328     if (len) {
5329         STRLEN boffset = 0;
5330         STRLEN *cache = 0;
5331         const U8 *s = start;
5332         I32 uoffset = *offsetp;
5333         const U8 * const send = s + len;
5334         MAGIC *mg = 0;
5335         bool found = FALSE;
5336
5337          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5338              found = TRUE;
5339          if (!found && uoffset > 0) {
5340               while (s < send && uoffset--)
5341                    s += UTF8SKIP(s);
5342               if (s >= send)
5343                    s = send;
5344               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5345                   boffset = cache[1];
5346               *offsetp = s - start;
5347          }
5348          if (lenp) {
5349               found = FALSE;
5350               start = s;
5351               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5352                   *lenp -= boffset;
5353                   found = TRUE;
5354               }
5355               if (!found && *lenp > 0) {
5356                    I32 ulen = *lenp;
5357                    if (ulen > 0)
5358                         while (s < send && ulen--)
5359                              s += UTF8SKIP(s);
5360                    if (s >= send)
5361                         s = send;
5362                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5363               }
5364               *lenp = s - start;
5365          }
5366          ASSERT_UTF8_CACHE(cache);
5367     }
5368     else {
5369          *offsetp = 0;
5370          if (lenp)
5371               *lenp = 0;
5372     }
5373
5374     return;
5375 }
5376
5377 /*
5378 =for apidoc sv_pos_b2u
5379
5380 Converts the value pointed to by offsetp from a count of bytes from the
5381 start of the string, to a count of the equivalent number of UTF-8 chars.
5382 Handles magic and type coercion.
5383
5384 =cut
5385 */
5386
5387 /*
5388  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5389  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5390  * byte offsets.  See also the comments of S_utf8_mg_pos().
5391  *
5392  */
5393
5394 void
5395 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5396 {
5397     const U8* s;
5398     STRLEN len;
5399
5400     if (!sv)
5401         return;
5402
5403     s = (const U8*)SvPV_const(sv, len);
5404     if ((I32)len < *offsetp)
5405         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5406     else {
5407         const U8* send = s + *offsetp;
5408         MAGIC* mg = NULL;
5409         STRLEN *cache = NULL;
5410
5411         len = 0;
5412
5413         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5414             mg = mg_find(sv, PERL_MAGIC_utf8);
5415             if (mg && mg->mg_ptr) {
5416                 cache = (STRLEN *) mg->mg_ptr;
5417                 if (cache[1] == (STRLEN)*offsetp) {
5418                     /* An exact match. */
5419                     *offsetp = cache[0];
5420
5421                     return;
5422                 }
5423                 else if (cache[1] < (STRLEN)*offsetp) {
5424                     /* We already know part of the way. */
5425                     len = cache[0];
5426                     s  += cache[1];
5427                     /* Let the below loop do the rest. */
5428                 }
5429                 else { /* cache[1] > *offsetp */
5430                     /* We already know all of the way, now we may
5431                      * be able to walk back.  The same assumption
5432                      * is made as in S_utf8_mg_pos(), namely that
5433                      * walking backward is twice slower than
5434                      * walking forward. */
5435                     const STRLEN forw  = *offsetp;
5436                     STRLEN backw = cache[1] - *offsetp;
5437
5438                     if (!(forw < 2 * backw)) {
5439                         const U8 *p = s + cache[1];
5440                         STRLEN ubackw = 0;
5441                         
5442                         cache[1] -= backw;
5443
5444                         while (backw--) {
5445                             p--;
5446                             while (UTF8_IS_CONTINUATION(*p)) {
5447                                 p--;
5448                                 backw--;
5449                             }
5450                             ubackw++;
5451                         }
5452
5453                         cache[0] -= ubackw;
5454                         *offsetp = cache[0];
5455
5456                         /* Drop the stale "length" cache */
5457                         cache[2] = 0;
5458                         cache[3] = 0;
5459
5460                         return;
5461                     }
5462                 }
5463             }
5464             ASSERT_UTF8_CACHE(cache);
5465         }
5466
5467         while (s < send) {
5468             STRLEN n = 1;
5469
5470             /* Call utf8n_to_uvchr() to validate the sequence
5471              * (unless a simple non-UTF character) */
5472             if (!UTF8_IS_INVARIANT(*s))
5473                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5474             if (n > 0) {
5475                 s += n;
5476                 len++;
5477             }
5478             else
5479                 break;
5480         }
5481
5482         if (!SvREADONLY(sv)) {
5483             if (!mg) {
5484                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5485                 mg = mg_find(sv, PERL_MAGIC_utf8);
5486             }
5487             assert(mg);
5488
5489             if (!mg->mg_ptr) {
5490                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5491                 mg->mg_ptr = (char *) cache;
5492             }
5493             assert(cache);
5494
5495             cache[0] = len;
5496             cache[1] = *offsetp;
5497             /* Drop the stale "length" cache */
5498             cache[2] = 0;
5499             cache[3] = 0;
5500         }
5501
5502         *offsetp = len;
5503     }
5504     return;
5505 }
5506
5507 /*
5508 =for apidoc sv_eq
5509
5510 Returns a boolean indicating whether the strings in the two SVs are
5511 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5512 coerce its args to strings if necessary.
5513
5514 =cut
5515 */
5516
5517 I32
5518 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5519 {
5520     const char *pv1;
5521     STRLEN cur1;
5522     const char *pv2;
5523     STRLEN cur2;
5524     I32  eq     = 0;
5525     char *tpv   = Nullch;
5526     SV* svrecode = Nullsv;
5527
5528     if (!sv1) {
5529         pv1 = "";
5530         cur1 = 0;
5531     }
5532     else
5533         pv1 = SvPV_const(sv1, cur1);
5534
5535     if (!sv2){
5536         pv2 = "";
5537         cur2 = 0;
5538     }
5539     else
5540         pv2 = SvPV_const(sv2, cur2);
5541
5542     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5543         /* Differing utf8ness.
5544          * Do not UTF8size the comparands as a side-effect. */
5545          if (PL_encoding) {
5546               if (SvUTF8(sv1)) {
5547                    svrecode = newSVpvn(pv2, cur2);
5548                    sv_recode_to_utf8(svrecode, PL_encoding);
5549                    pv2 = SvPV_const(svrecode, cur2);
5550               }
5551               else {
5552                    svrecode = newSVpvn(pv1, cur1);
5553                    sv_recode_to_utf8(svrecode, PL_encoding);
5554                    pv1 = SvPV_const(svrecode, cur1);
5555               }
5556               /* Now both are in UTF-8. */
5557               if (cur1 != cur2) {
5558                    SvREFCNT_dec(svrecode);
5559                    return FALSE;
5560               }
5561          }
5562          else {
5563               bool is_utf8 = TRUE;
5564
5565               if (SvUTF8(sv1)) {
5566                    /* sv1 is the UTF-8 one,
5567                     * if is equal it must be downgrade-able */
5568                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5569                                                      &cur1, &is_utf8);
5570                    if (pv != pv1)
5571                         pv1 = tpv = pv;
5572               }
5573               else {
5574                    /* sv2 is the UTF-8 one,
5575                     * if is equal it must be downgrade-able */
5576                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5577                                                       &cur2, &is_utf8);
5578                    if (pv != pv2)
5579                         pv2 = tpv = pv;
5580               }
5581               if (is_utf8) {
5582                    /* Downgrade not possible - cannot be eq */
5583                    assert (tpv == 0);
5584                    return FALSE;
5585               }
5586          }
5587     }
5588
5589     if (cur1 == cur2)
5590         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5591         
5592     if (svrecode)
5593          SvREFCNT_dec(svrecode);
5594
5595     if (tpv)
5596         Safefree(tpv);
5597
5598     return eq;
5599 }
5600
5601 /*
5602 =for apidoc sv_cmp
5603
5604 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5605 string in C<sv1> is less than, equal to, or greater than the string in
5606 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5607 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5608
5609 =cut
5610 */
5611
5612 I32
5613 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5614 {
5615     STRLEN cur1, cur2;
5616     const char *pv1, *pv2;
5617     char *tpv = Nullch;
5618     I32  cmp;
5619     SV *svrecode = Nullsv;
5620
5621     if (!sv1) {
5622         pv1 = "";
5623         cur1 = 0;
5624     }
5625     else
5626         pv1 = SvPV_const(sv1, cur1);
5627
5628     if (!sv2) {
5629         pv2 = "";
5630         cur2 = 0;
5631     }
5632     else
5633         pv2 = SvPV_const(sv2, cur2);
5634
5635     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5636         /* Differing utf8ness.
5637          * Do not UTF8size the comparands as a side-effect. */
5638         if (SvUTF8(sv1)) {
5639             if (PL_encoding) {
5640                  svrecode = newSVpvn(pv2, cur2);
5641                  sv_recode_to_utf8(svrecode, PL_encoding);
5642                  pv2 = SvPV_const(svrecode, cur2);
5643             }
5644             else {
5645                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5646             }
5647         }
5648         else {
5649             if (PL_encoding) {
5650                  svrecode = newSVpvn(pv1, cur1);
5651                  sv_recode_to_utf8(svrecode, PL_encoding);
5652                  pv1 = SvPV_const(svrecode, cur1);
5653             }
5654             else {
5655                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5656             }
5657         }
5658     }
5659
5660     if (!cur1) {
5661         cmp = cur2 ? -1 : 0;
5662     } else if (!cur2) {
5663         cmp = 1;
5664     } else {
5665         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5666
5667         if (retval) {
5668             cmp = retval < 0 ? -1 : 1;
5669         } else if (cur1 == cur2) {
5670             cmp = 0;
5671         } else {
5672             cmp = cur1 < cur2 ? -1 : 1;
5673         }
5674     }
5675
5676     if (svrecode)
5677          SvREFCNT_dec(svrecode);
5678
5679     if (tpv)
5680         Safefree(tpv);
5681
5682     return cmp;
5683 }
5684
5685 /*
5686 =for apidoc sv_cmp_locale
5687
5688 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5689 'use bytes' aware, handles get magic, and will coerce its args to strings
5690 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5691
5692 =cut
5693 */
5694
5695 I32
5696 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5697 {
5698 #ifdef USE_LOCALE_COLLATE
5699
5700     char *pv1, *pv2;
5701     STRLEN len1, len2;
5702     I32 retval;
5703
5704     if (PL_collation_standard)
5705         goto raw_compare;
5706
5707     len1 = 0;
5708     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5709     len2 = 0;
5710     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5711
5712     if (!pv1 || !len1) {
5713         if (pv2 && len2)
5714             return -1;
5715         else
5716             goto raw_compare;
5717     }
5718     else {
5719         if (!pv2 || !len2)
5720             return 1;
5721     }
5722
5723     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5724
5725     if (retval)
5726         return retval < 0 ? -1 : 1;
5727
5728     /*
5729      * When the result of collation is equality, that doesn't mean
5730      * that there are no differences -- some locales exclude some
5731      * characters from consideration.  So to avoid false equalities,
5732      * we use the raw string as a tiebreaker.
5733      */
5734
5735   raw_compare:
5736     /* FALL THROUGH */
5737
5738 #endif /* USE_LOCALE_COLLATE */
5739
5740     return sv_cmp(sv1, sv2);
5741 }
5742
5743
5744 #ifdef USE_LOCALE_COLLATE
5745
5746 /*
5747 =for apidoc sv_collxfrm
5748
5749 Add Collate Transform magic to an SV if it doesn't already have it.
5750
5751 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5752 scalar data of the variable, but transformed to such a format that a normal
5753 memory comparison can be used to compare the data according to the locale
5754 settings.
5755
5756 =cut
5757 */
5758
5759 char *
5760 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5761 {
5762     MAGIC *mg;
5763
5764     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5765     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5766         const char *s;
5767         char *xf;
5768         STRLEN len, xlen;
5769
5770         if (mg)
5771             Safefree(mg->mg_ptr);
5772         s = SvPV_const(sv, len);
5773         if ((xf = mem_collxfrm(s, len, &xlen))) {
5774             if (SvREADONLY(sv)) {
5775                 SAVEFREEPV(xf);
5776                 *nxp = xlen;
5777                 return xf + sizeof(PL_collation_ix);
5778             }
5779             if (! mg) {
5780                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5781                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5782                 assert(mg);
5783             }
5784             mg->mg_ptr = xf;
5785             mg->mg_len = xlen;
5786         }
5787         else {
5788             if (mg) {
5789                 mg->mg_ptr = NULL;
5790                 mg->mg_len = -1;
5791             }
5792         }
5793     }
5794     if (mg && mg->mg_ptr) {
5795         *nxp = mg->mg_len;
5796         return mg->mg_ptr + sizeof(PL_collation_ix);
5797     }
5798     else {
5799         *nxp = 0;
5800         return NULL;
5801     }
5802 }
5803
5804 #endif /* USE_LOCALE_COLLATE */
5805
5806 /*
5807 =for apidoc sv_gets
5808
5809 Get a line from the filehandle and store it into the SV, optionally
5810 appending to the currently-stored string.
5811
5812 =cut
5813 */
5814
5815 char *
5816 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5817 {
5818     const char *rsptr;
5819     STRLEN rslen;
5820     register STDCHAR rslast;
5821     register STDCHAR *bp;
5822     register I32 cnt;
5823     I32 i = 0;
5824     I32 rspara = 0;
5825     I32 recsize;
5826
5827     if (SvTHINKFIRST(sv))
5828         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5829     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5830        from <>.
5831        However, perlbench says it's slower, because the existing swipe code
5832        is faster than copy on write.
5833        Swings and roundabouts.  */
5834     SvUPGRADE(sv, SVt_PV);
5835
5836     SvSCREAM_off(sv);
5837
5838     if (append) {
5839         if (PerlIO_isutf8(fp)) {
5840             if (!SvUTF8(sv)) {
5841                 sv_utf8_upgrade_nomg(sv);
5842                 sv_pos_u2b(sv,&append,0);
5843             }
5844         } else if (SvUTF8(sv)) {
5845             SV * const tsv = NEWSV(0,0);
5846             sv_gets(tsv, fp, 0);
5847             sv_utf8_upgrade_nomg(tsv);
5848             SvCUR_set(sv,append);
5849             sv_catsv(sv,tsv);
5850             sv_free(tsv);
5851             goto return_string_or_null;
5852         }
5853     }
5854
5855     SvPOK_only(sv);
5856     if (PerlIO_isutf8(fp))
5857         SvUTF8_on(sv);
5858
5859     if (IN_PERL_COMPILETIME) {
5860         /* we always read code in line mode */
5861         rsptr = "\n";
5862         rslen = 1;
5863     }
5864     else if (RsSNARF(PL_rs)) {
5865         /* If it is a regular disk file use size from stat() as estimate
5866            of amount we are going to read - may result in malloc-ing
5867            more memory than we realy need if layers bellow reduce
5868            size we read (e.g. CRLF or a gzip layer)
5869          */
5870         Stat_t st;
5871         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5872             const Off_t offset = PerlIO_tell(fp);
5873             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5874                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5875             }
5876         }
5877         rsptr = NULL;
5878         rslen = 0;
5879     }
5880     else if (RsRECORD(PL_rs)) {
5881       I32 bytesread;
5882       char *buffer;
5883
5884       /* Grab the size of the record we're getting */
5885       recsize = SvIV(SvRV(PL_rs));
5886       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5887       /* Go yank in */
5888 #ifdef VMS
5889       /* VMS wants read instead of fread, because fread doesn't respect */
5890       /* RMS record boundaries. This is not necessarily a good thing to be */
5891       /* doing, but we've got no other real choice - except avoid stdio
5892          as implementation - perhaps write a :vms layer ?
5893        */
5894       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5895 #else
5896       bytesread = PerlIO_read(fp, buffer, recsize);
5897 #endif
5898       if (bytesread < 0)
5899           bytesread = 0;
5900       SvCUR_set(sv, bytesread += append);
5901       buffer[bytesread] = '\0';
5902       goto return_string_or_null;
5903     }
5904     else if (RsPARA(PL_rs)) {
5905         rsptr = "\n\n";
5906         rslen = 2;
5907         rspara = 1;
5908     }
5909     else {
5910         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5911         if (PerlIO_isutf8(fp)) {
5912             rsptr = SvPVutf8(PL_rs, rslen);
5913         }
5914         else {
5915             if (SvUTF8(PL_rs)) {
5916                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5917                     Perl_croak(aTHX_ "Wide character in $/");
5918                 }
5919             }
5920             rsptr = SvPV_const(PL_rs, rslen);
5921         }
5922     }
5923
5924     rslast = rslen ? rsptr[rslen - 1] : '\0';
5925
5926     if (rspara) {               /* have to do this both before and after */
5927         do {                    /* to make sure file boundaries work right */
5928             if (PerlIO_eof(fp))
5929                 return 0;
5930             i = PerlIO_getc(fp);
5931             if (i != '\n') {
5932                 if (i == -1)
5933                     return 0;
5934                 PerlIO_ungetc(fp,i);
5935                 break;
5936             }
5937         } while (i != EOF);
5938     }
5939
5940     /* See if we know enough about I/O mechanism to cheat it ! */
5941
5942     /* This used to be #ifdef test - it is made run-time test for ease
5943        of abstracting out stdio interface. One call should be cheap
5944        enough here - and may even be a macro allowing compile
5945        time optimization.
5946      */
5947
5948     if (PerlIO_fast_gets(fp)) {
5949
5950     /*
5951      * We're going to steal some values from the stdio struct
5952      * and put EVERYTHING in the innermost loop into registers.
5953      */
5954     register STDCHAR *ptr;
5955     STRLEN bpx;
5956     I32 shortbuffered;
5957
5958 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5959     /* An ungetc()d char is handled separately from the regular
5960      * buffer, so we getc() it back out and stuff it in the buffer.
5961      */
5962     i = PerlIO_getc(fp);
5963     if (i == EOF) return 0;
5964     *(--((*fp)->_ptr)) = (unsigned char) i;
5965     (*fp)->_cnt++;
5966 #endif
5967
5968     /* Here is some breathtakingly efficient cheating */
5969
5970     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5971     /* make sure we have the room */
5972     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5973         /* Not room for all of it
5974            if we are looking for a separator and room for some
5975          */
5976         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5977             /* just process what we have room for */
5978             shortbuffered = cnt - SvLEN(sv) + append + 1;
5979             cnt -= shortbuffered;
5980         }
5981         else {
5982             shortbuffered = 0;
5983             /* remember that cnt can be negative */
5984             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5985         }
5986     }
5987     else
5988         shortbuffered = 0;
5989     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
5990     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
5991     DEBUG_P(PerlIO_printf(Perl_debug_log,
5992         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5993     DEBUG_P(PerlIO_printf(Perl_debug_log,
5994         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5995                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5996                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
5997     for (;;) {
5998       screamer:
5999         if (cnt > 0) {
6000             if (rslen) {
6001                 while (cnt > 0) {                    /* this     |  eat */
6002                     cnt--;
6003                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
6004                         goto thats_all_folks;        /* screams  |  sed :-) */
6005                 }
6006             }
6007             else {
6008                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
6009                 bp += cnt;                           /* screams  |  dust */
6010                 ptr += cnt;                          /* louder   |  sed :-) */
6011                 cnt = 0;
6012             }
6013         }
6014         
6015         if (shortbuffered) {            /* oh well, must extend */
6016             cnt = shortbuffered;
6017             shortbuffered = 0;
6018             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
6019             SvCUR_set(sv, bpx);
6020             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
6021             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
6022             continue;
6023         }
6024
6025         DEBUG_P(PerlIO_printf(Perl_debug_log,
6026                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
6027                               PTR2UV(ptr),(long)cnt));
6028         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
6029 #if 0
6030         DEBUG_P(PerlIO_printf(Perl_debug_log,
6031             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6032             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6033             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6034 #endif
6035         /* This used to call 'filbuf' in stdio form, but as that behaves like
6036            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
6037            another abstraction.  */
6038         i   = PerlIO_getc(fp);          /* get more characters */
6039 #if 0
6040         DEBUG_P(PerlIO_printf(Perl_debug_log,
6041             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6042             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6043             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6044 #endif
6045         cnt = PerlIO_get_cnt(fp);
6046         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
6047         DEBUG_P(PerlIO_printf(Perl_debug_log,
6048             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6049
6050         if (i == EOF)                   /* all done for ever? */
6051             goto thats_really_all_folks;
6052
6053         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
6054         SvCUR_set(sv, bpx);
6055         SvGROW(sv, bpx + cnt + 2);
6056         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
6057
6058         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
6059
6060         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
6061             goto thats_all_folks;
6062     }
6063
6064 thats_all_folks:
6065     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
6066           memNE((char*)bp - rslen, rsptr, rslen))
6067         goto screamer;                          /* go back to the fray */
6068 thats_really_all_folks:
6069     if (shortbuffered)
6070         cnt += shortbuffered;
6071         DEBUG_P(PerlIO_printf(Perl_debug_log,
6072             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
6073     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
6074     DEBUG_P(PerlIO_printf(Perl_debug_log,
6075         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
6076         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
6077         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
6078     *bp = '\0';
6079     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
6080     DEBUG_P(PerlIO_printf(Perl_debug_log,
6081         "Screamer: done, len=%ld, string=|%.*s|\n",
6082         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
6083     }
6084    else
6085     {
6086        /*The big, slow, and stupid way. */
6087 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
6088         STDCHAR *buf = 0;
6089         Newx(buf, 8192, STDCHAR);
6090         assert(buf);
6091 #else
6092         STDCHAR buf[8192];
6093 #endif
6094
6095 screamer2:
6096         if (rslen) {
6097             register const STDCHAR *bpe = buf + sizeof(buf);
6098             bp = buf;
6099             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
6100                 ; /* keep reading */
6101             cnt = bp - buf;
6102         }
6103         else {
6104             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
6105             /* Accomodate broken VAXC compiler, which applies U8 cast to
6106              * both args of ?: operator, causing EOF to change into 255
6107              */
6108             if (cnt > 0)
6109                  i = (U8)buf[cnt - 1];
6110             else
6111                  i = EOF;
6112         }
6113
6114         if (cnt < 0)
6115             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
6116         if (append)
6117              sv_catpvn(sv, (char *) buf, cnt);
6118         else
6119              sv_setpvn(sv, (char *) buf, cnt);
6120
6121         if (i != EOF &&                 /* joy */
6122             (!rslen ||
6123              SvCUR(sv) < rslen ||
6124              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
6125         {
6126             append = -1;
6127             /*
6128              * If we're reading from a TTY and we get a short read,
6129              * indicating that the user hit his EOF character, we need
6130              * to notice it now, because if we try to read from the TTY
6131              * again, the EOF condition will disappear.
6132              *
6133              * The comparison of cnt to sizeof(buf) is an optimization
6134              * that prevents unnecessary calls to feof().
6135              *
6136              * - jik 9/25/96
6137              */
6138             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
6139                 goto screamer2;
6140         }
6141
6142 #ifdef USE_HEAP_INSTEAD_OF_STACK
6143         Safefree(buf);
6144 #endif
6145     }
6146
6147     if (rspara) {               /* have to do this both before and after */
6148         while (i != EOF) {      /* to make sure file boundaries work right */
6149             i = PerlIO_getc(fp);
6150             if (i != '\n') {
6151                 PerlIO_ungetc(fp,i);
6152                 break;
6153             }
6154         }
6155     }
6156
6157 return_string_or_null:
6158     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
6159 }
6160
6161 /*
6162 =for apidoc sv_inc
6163
6164 Auto-increment of the value in the SV, doing string to numeric conversion
6165 if necessary. Handles 'get' magic.
6166
6167 =cut
6168 */
6169
6170 void
6171 Perl_sv_inc(pTHX_ register SV *sv)
6172 {
6173     register char *d;
6174     int flags;
6175
6176     if (!sv)
6177         return;
6178     SvGETMAGIC(sv);
6179     if (SvTHINKFIRST(sv)) {
6180         if (SvIsCOW(sv))
6181             sv_force_normal_flags(sv, 0);
6182         if (SvREADONLY(sv)) {
6183             if (IN_PERL_RUNTIME)
6184                 Perl_croak(aTHX_ PL_no_modify);
6185         }
6186         if (SvROK(sv)) {
6187             IV i;
6188             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
6189                 return;
6190             i = PTR2IV(SvRV(sv));
6191             sv_unref(sv);
6192             sv_setiv(sv, i);
6193         }
6194     }
6195     flags = SvFLAGS(sv);
6196     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
6197         /* It's (privately or publicly) a float, but not tested as an
6198            integer, so test it to see. */
6199         (void) SvIV(sv);
6200         flags = SvFLAGS(sv);
6201     }
6202     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6203         /* It's publicly an integer, or privately an integer-not-float */
6204 #ifdef PERL_PRESERVE_IVUV
6205       oops_its_int:
6206 #endif
6207         if (SvIsUV(sv)) {
6208             if (SvUVX(sv) == UV_MAX)
6209                 sv_setnv(sv, UV_MAX_P1);
6210             else
6211                 (void)SvIOK_only_UV(sv);
6212                 SvUV_set(sv, SvUVX(sv) + 1);
6213         } else {
6214             if (SvIVX(sv) == IV_MAX)
6215                 sv_setuv(sv, (UV)IV_MAX + 1);
6216             else {
6217                 (void)SvIOK_only(sv);
6218                 SvIV_set(sv, SvIVX(sv) + 1);
6219             }   
6220         }
6221         return;
6222     }
6223     if (flags & SVp_NOK) {
6224         (void)SvNOK_only(sv);
6225         SvNV_set(sv, SvNVX(sv) + 1.0);
6226         return;
6227     }
6228
6229     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6230         if ((flags & SVTYPEMASK) < SVt_PVIV)
6231             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6232         (void)SvIOK_only(sv);
6233         SvIV_set(sv, 1);
6234         return;
6235     }
6236     d = SvPVX(sv);
6237     while (isALPHA(*d)) d++;
6238     while (isDIGIT(*d)) d++;
6239     if (*d) {
6240 #ifdef PERL_PRESERVE_IVUV
6241         /* Got to punt this as an integer if needs be, but we don't issue
6242            warnings. Probably ought to make the sv_iv_please() that does
6243            the conversion if possible, and silently.  */
6244         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6245         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6246             /* Need to try really hard to see if it's an integer.
6247                9.22337203685478e+18 is an integer.
6248                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6249                so $a="9.22337203685478e+18"; $a+0; $a++
6250                needs to be the same as $a="9.22337203685478e+18"; $a++
6251                or we go insane. */
6252         
6253             (void) sv_2iv(sv);
6254             if (SvIOK(sv))
6255                 goto oops_its_int;
6256
6257             /* sv_2iv *should* have made this an NV */
6258             if (flags & SVp_NOK) {
6259                 (void)SvNOK_only(sv);
6260                 SvNV_set(sv, SvNVX(sv) + 1.0);
6261                 return;
6262             }
6263             /* I don't think we can get here. Maybe I should assert this
6264                And if we do get here I suspect that sv_setnv will croak. NWC
6265                Fall through. */
6266 #if defined(USE_LONG_DOUBLE)
6267             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6268                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6269 #else
6270             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6271                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6272 #endif
6273         }
6274 #endif /* PERL_PRESERVE_IVUV */
6275         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6276         return;
6277     }
6278     d--;
6279     while (d >= SvPVX_const(sv)) {
6280         if (isDIGIT(*d)) {
6281             if (++*d <= '9')
6282                 return;
6283             *(d--) = '0';
6284         }
6285         else {
6286 #ifdef EBCDIC
6287             /* MKS: The original code here died if letters weren't consecutive.
6288              * at least it didn't have to worry about non-C locales.  The
6289              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6290              * arranged in order (although not consecutively) and that only
6291              * [A-Za-z] are accepted by isALPHA in the C locale.
6292              */
6293             if (*d != 'z' && *d != 'Z') {
6294                 do { ++*d; } while (!isALPHA(*d));
6295                 return;
6296             }
6297             *(d--) -= 'z' - 'a';
6298 #else
6299             ++*d;
6300             if (isALPHA(*d))
6301                 return;
6302             *(d--) -= 'z' - 'a' + 1;
6303 #endif
6304         }
6305     }
6306     /* oh,oh, the number grew */
6307     SvGROW(sv, SvCUR(sv) + 2);
6308     SvCUR_set(sv, SvCUR(sv) + 1);
6309     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6310         *d = d[-1];
6311     if (isDIGIT(d[1]))
6312         *d = '1';
6313     else
6314         *d = d[1];
6315 }
6316
6317 /*
6318 =for apidoc sv_dec
6319
6320 Auto-decrement of the value in the SV, doing string to numeric conversion
6321 if necessary. Handles 'get' magic.
6322
6323 =cut
6324 */
6325
6326 void
6327 Perl_sv_dec(pTHX_ register SV *sv)
6328 {
6329     int flags;
6330
6331     if (!sv)
6332         return;
6333     SvGETMAGIC(sv);
6334     if (SvTHINKFIRST(sv)) {
6335         if (SvIsCOW(sv))
6336             sv_force_normal_flags(sv, 0);
6337         if (SvREADONLY(sv)) {
6338             if (IN_PERL_RUNTIME)
6339                 Perl_croak(aTHX_ PL_no_modify);
6340         }
6341         if (SvROK(sv)) {
6342             IV i;
6343             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6344                 return;
6345             i = PTR2IV(SvRV(sv));
6346             sv_unref(sv);
6347             sv_setiv(sv, i);
6348         }
6349     }
6350     /* Unlike sv_inc we don't have to worry about string-never-numbers
6351        and keeping them magic. But we mustn't warn on punting */
6352     flags = SvFLAGS(sv);
6353     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6354         /* It's publicly an integer, or privately an integer-not-float */
6355 #ifdef PERL_PRESERVE_IVUV
6356       oops_its_int:
6357 #endif
6358         if (SvIsUV(sv)) {
6359             if (SvUVX(sv) == 0) {
6360                 (void)SvIOK_only(sv);
6361                 SvIV_set(sv, -1);
6362             }
6363             else {
6364                 (void)SvIOK_only_UV(sv);
6365                 SvUV_set(sv, SvUVX(sv) - 1);
6366             }   
6367         } else {
6368             if (SvIVX(sv) == IV_MIN)
6369                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6370             else {
6371                 (void)SvIOK_only(sv);
6372                 SvIV_set(sv, SvIVX(sv) - 1);
6373             }   
6374         }
6375         return;
6376     }
6377     if (flags & SVp_NOK) {
6378         SvNV_set(sv, SvNVX(sv) - 1.0);
6379         (void)SvNOK_only(sv);
6380         return;
6381     }
6382     if (!(flags & SVp_POK)) {
6383         if ((flags & SVTYPEMASK) < SVt_PVIV)
6384             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6385         SvIV_set(sv, -1);
6386         (void)SvIOK_only(sv);
6387         return;
6388     }
6389 #ifdef PERL_PRESERVE_IVUV
6390     {
6391         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6392         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6393             /* Need to try really hard to see if it's an integer.
6394                9.22337203685478e+18 is an integer.
6395                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6396                so $a="9.22337203685478e+18"; $a+0; $a--
6397                needs to be the same as $a="9.22337203685478e+18"; $a--
6398                or we go insane. */
6399         
6400             (void) sv_2iv(sv);
6401             if (SvIOK(sv))
6402                 goto oops_its_int;
6403
6404             /* sv_2iv *should* have made this an NV */
6405             if (flags & SVp_NOK) {
6406                 (void)SvNOK_only(sv);
6407                 SvNV_set(sv, SvNVX(sv) - 1.0);
6408                 return;
6409             }
6410             /* I don't think we can get here. Maybe I should assert this
6411                And if we do get here I suspect that sv_setnv will croak. NWC
6412                Fall through. */
6413 #if defined(USE_LONG_DOUBLE)
6414             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6415                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6416 #else
6417             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6418                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6419 #endif
6420         }
6421     }
6422 #endif /* PERL_PRESERVE_IVUV */
6423     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6424 }
6425
6426 /*
6427 =for apidoc sv_mortalcopy
6428
6429 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6430 The new SV is marked as mortal. It will be destroyed "soon", either by an
6431 explicit call to FREETMPS, or by an implicit call at places such as
6432 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6433
6434 =cut
6435 */
6436
6437 /* Make a string that will exist for the duration of the expression
6438  * evaluation.  Actually, it may have to last longer than that, but
6439  * hopefully we won't free it until it has been assigned to a
6440  * permanent location. */
6441
6442 SV *
6443 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6444 {
6445     register SV *sv;
6446
6447     new_SV(sv);
6448     sv_setsv(sv,oldstr);
6449     EXTEND_MORTAL(1);
6450     PL_tmps_stack[++PL_tmps_ix] = sv;
6451     SvTEMP_on(sv);
6452     return sv;
6453 }
6454
6455 /*
6456 =for apidoc sv_newmortal
6457
6458 Creates a new null SV which is mortal.  The reference count of the SV is
6459 set to 1. It will be destroyed "soon", either by an explicit call to
6460 FREETMPS, or by an implicit call at places such as statement boundaries.
6461 See also C<sv_mortalcopy> and C<sv_2mortal>.
6462
6463 =cut
6464 */
6465
6466 SV *
6467 Perl_sv_newmortal(pTHX)
6468 {
6469     register SV *sv;
6470
6471     new_SV(sv);
6472     SvFLAGS(sv) = SVs_TEMP;
6473     EXTEND_MORTAL(1);
6474     PL_tmps_stack[++PL_tmps_ix] = sv;
6475     return sv;
6476 }
6477
6478 /*
6479 =for apidoc sv_2mortal
6480
6481 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6482 by an explicit call to FREETMPS, or by an implicit call at places such as
6483 statement boundaries.  SvTEMP() is turned on which means that the SV's
6484 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6485 and C<sv_mortalcopy>.
6486
6487 =cut
6488 */
6489
6490 SV *
6491 Perl_sv_2mortal(pTHX_ register SV *sv)
6492 {
6493     dVAR;
6494     if (!sv)
6495         return sv;
6496     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6497         return sv;
6498     EXTEND_MORTAL(1);
6499     PL_tmps_stack[++PL_tmps_ix] = sv;
6500     SvTEMP_on(sv);
6501     return sv;
6502 }
6503
6504 /*
6505 =for apidoc newSVpv
6506
6507 Creates a new SV and copies a string into it.  The reference count for the
6508 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6509 strlen().  For efficiency, consider using C<newSVpvn> instead.
6510
6511 =cut
6512 */
6513
6514 SV *
6515 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6516 {
6517     register SV *sv;
6518
6519     new_SV(sv);
6520     sv_setpvn(sv,s,len ? len : strlen(s));
6521     return sv;
6522 }
6523
6524 /*
6525 =for apidoc newSVpvn
6526
6527 Creates a new SV and copies a string into it.  The reference count for the
6528 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6529 string.  You are responsible for ensuring that the source string is at least
6530 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6531
6532 =cut
6533 */
6534
6535 SV *
6536 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6537 {
6538     register SV *sv;
6539
6540     new_SV(sv);
6541     sv_setpvn(sv,s,len);
6542     return sv;
6543 }
6544
6545
6546 /*
6547 =for apidoc newSVhek
6548
6549 Creates a new SV from the hash key structure.  It will generate scalars that
6550 point to the shared string table where possible. Returns a new (undefined)
6551 SV if the hek is NULL.
6552
6553 =cut
6554 */
6555
6556 SV *
6557 Perl_newSVhek(pTHX_ const HEK *hek)
6558 {
6559     if (!hek) {
6560         SV *sv;
6561
6562         new_SV(sv);
6563         return sv;
6564     }
6565
6566     if (HEK_LEN(hek) == HEf_SVKEY) {
6567         return newSVsv(*(SV**)HEK_KEY(hek));
6568     } else {
6569         const int flags = HEK_FLAGS(hek);
6570         if (flags & HVhek_WASUTF8) {
6571             /* Trouble :-)
6572                Andreas would like keys he put in as utf8 to come back as utf8
6573             */
6574             STRLEN utf8_len = HEK_LEN(hek);
6575             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6576             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6577
6578             SvUTF8_on (sv);
6579             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6580             return sv;
6581         } else if (flags & HVhek_REHASH) {
6582             /* We don't have a pointer to the hv, so we have to replicate the
6583                flag into every HEK. This hv is using custom a hasing
6584                algorithm. Hence we can't return a shared string scalar, as
6585                that would contain the (wrong) hash value, and might get passed
6586                into an hv routine with a regular hash  */
6587
6588             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6589             if (HEK_UTF8(hek))
6590                 SvUTF8_on (sv);
6591             return sv;
6592         }
6593         /* This will be overwhelminly the most common case.  */
6594         return newSVpvn_share(HEK_KEY(hek),
6595                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6596                               HEK_HASH(hek));
6597     }
6598 }
6599
6600 /*
6601 =for apidoc newSVpvn_share
6602
6603 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6604 table. If the string does not already exist in the table, it is created
6605 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6606 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6607 otherwise the hash is computed.  The idea here is that as the string table
6608 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6609 hash lookup will avoid string compare.
6610
6611 =cut
6612 */
6613
6614 SV *
6615 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6616 {
6617     register SV *sv;
6618     bool is_utf8 = FALSE;
6619     if (len < 0) {
6620         STRLEN tmplen = -len;
6621         is_utf8 = TRUE;
6622         /* See the note in hv.c:hv_fetch() --jhi */
6623         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6624         len = tmplen;
6625     }
6626     if (!hash)
6627         PERL_HASH(hash, src, len);
6628     new_SV(sv);
6629     sv_upgrade(sv, SVt_PV);
6630     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6631     SvCUR_set(sv, len);
6632     SvLEN_set(sv, 0);
6633     SvREADONLY_on(sv);
6634     SvFAKE_on(sv);
6635     SvPOK_on(sv);
6636     if (is_utf8)
6637         SvUTF8_on(sv);
6638     return sv;
6639 }
6640
6641
6642 #if defined(PERL_IMPLICIT_CONTEXT)
6643
6644 /* pTHX_ magic can't cope with varargs, so this is a no-context
6645  * version of the main function, (which may itself be aliased to us).
6646  * Don't access this version directly.
6647  */
6648
6649 SV *
6650 Perl_newSVpvf_nocontext(const char* pat, ...)
6651 {
6652     dTHX;
6653     register SV *sv;
6654     va_list args;
6655     va_start(args, pat);
6656     sv = vnewSVpvf(pat, &args);
6657     va_end(args);
6658     return sv;
6659 }
6660 #endif
6661
6662 /*
6663 =for apidoc newSVpvf
6664
6665 Creates a new SV and initializes it with the string formatted like
6666 C<sprintf>.
6667
6668 =cut
6669 */
6670
6671 SV *
6672 Perl_newSVpvf(pTHX_ const char* pat, ...)
6673 {
6674     register SV *sv;
6675     va_list args;
6676     va_start(args, pat);
6677     sv = vnewSVpvf(pat, &args);
6678     va_end(args);
6679     return sv;
6680 }
6681
6682 /* backend for newSVpvf() and newSVpvf_nocontext() */
6683
6684 SV *
6685 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6686 {
6687     register SV *sv;
6688     new_SV(sv);
6689     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6690     return sv;
6691 }
6692
6693 /*
6694 =for apidoc newSVnv
6695
6696 Creates a new SV and copies a floating point value into it.
6697 The reference count for the SV is set to 1.
6698
6699 =cut
6700 */
6701
6702 SV *
6703 Perl_newSVnv(pTHX_ NV n)
6704 {
6705     register SV *sv;
6706
6707     new_SV(sv);
6708     sv_setnv(sv,n);
6709     return sv;
6710 }
6711
6712 /*
6713 =for apidoc newSViv
6714
6715 Creates a new SV and copies an integer into it.  The reference count for the
6716 SV is set to 1.
6717
6718 =cut
6719 */
6720
6721 SV *
6722 Perl_newSViv(pTHX_ IV i)
6723 {
6724     register SV *sv;
6725
6726     new_SV(sv);
6727     sv_setiv(sv,i);
6728     return sv;
6729 }
6730
6731 /*
6732 =for apidoc newSVuv
6733
6734 Creates a new SV and copies an unsigned integer into it.
6735 The reference count for the SV is set to 1.
6736
6737 =cut
6738 */
6739
6740 SV *
6741 Perl_newSVuv(pTHX_ UV u)
6742 {
6743     register SV *sv;
6744
6745     new_SV(sv);
6746     sv_setuv(sv,u);
6747     return sv;
6748 }
6749
6750 /*
6751 =for apidoc newRV_noinc
6752
6753 Creates an RV wrapper for an SV.  The reference count for the original
6754 SV is B<not> incremented.
6755
6756 =cut
6757 */
6758
6759 SV *
6760 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6761 {
6762     register SV *sv;
6763
6764     new_SV(sv);
6765     sv_upgrade(sv, SVt_RV);
6766     SvTEMP_off(tmpRef);
6767     SvRV_set(sv, tmpRef);
6768     SvROK_on(sv);
6769     return sv;
6770 }
6771
6772 /* newRV_inc is the official function name to use now.
6773  * newRV_inc is in fact #defined to newRV in sv.h
6774  */
6775
6776 SV *
6777 Perl_newRV(pTHX_ SV *tmpRef)
6778 {
6779     return newRV_noinc(SvREFCNT_inc(tmpRef));
6780 }
6781
6782 /*
6783 =for apidoc newSVsv
6784
6785 Creates a new SV which is an exact duplicate of the original SV.
6786 (Uses C<sv_setsv>).
6787
6788 =cut
6789 */
6790
6791 SV *
6792 Perl_newSVsv(pTHX_ register SV *old)
6793 {
6794     register SV *sv;
6795
6796     if (!old)
6797         return Nullsv;
6798     if (SvTYPE(old) == SVTYPEMASK) {
6799         if (ckWARN_d(WARN_INTERNAL))
6800             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6801         return Nullsv;
6802     }
6803     new_SV(sv);
6804     /* SV_GMAGIC is the default for sv_setv()
6805        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6806        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6807     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6808     return sv;
6809 }
6810
6811 /*
6812 =for apidoc sv_reset
6813
6814 Underlying implementation for the C<reset> Perl function.
6815 Note that the perl-level function is vaguely deprecated.
6816
6817 =cut
6818 */
6819
6820 void
6821 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6822 {
6823     dVAR;
6824     char todo[PERL_UCHAR_MAX+1];
6825
6826     if (!stash)
6827         return;
6828
6829     if (!*s) {          /* reset ?? searches */
6830         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6831         if (mg) {
6832             PMOP *pm = (PMOP *) mg->mg_obj;
6833             while (pm) {
6834                 pm->op_pmdynflags &= ~PMdf_USED;
6835                 pm = pm->op_pmnext;
6836             }
6837         }
6838         return;
6839     }
6840
6841     /* reset variables */
6842
6843     if (!HvARRAY(stash))
6844         return;
6845
6846     Zero(todo, 256, char);
6847     while (*s) {
6848         I32 max;
6849         I32 i = (unsigned char)*s;
6850         if (s[1] == '-') {
6851             s += 2;
6852         }
6853         max = (unsigned char)*s++;
6854         for ( ; i <= max; i++) {
6855             todo[i] = 1;
6856         }
6857         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6858             HE *entry;
6859             for (entry = HvARRAY(stash)[i];
6860                  entry;
6861                  entry = HeNEXT(entry))
6862             {
6863                 register GV *gv;
6864                 register SV *sv;
6865
6866                 if (!todo[(U8)*HeKEY(entry)])
6867                     continue;
6868                 gv = (GV*)HeVAL(entry);
6869                 sv = GvSV(gv);
6870                 if (sv) {
6871                     if (SvTHINKFIRST(sv)) {
6872                         if (!SvREADONLY(sv) && SvROK(sv))
6873                             sv_unref(sv);
6874                         /* XXX Is this continue a bug? Why should THINKFIRST
6875                            exempt us from resetting arrays and hashes?  */
6876                         continue;
6877                     }
6878                     SvOK_off(sv);
6879                     if (SvTYPE(sv) >= SVt_PV) {
6880                         SvCUR_set(sv, 0);
6881                         if (SvPVX_const(sv) != Nullch)
6882                             *SvPVX(sv) = '\0';
6883                         SvTAINT(sv);
6884                     }
6885                 }
6886                 if (GvAV(gv)) {
6887                     av_clear(GvAV(gv));
6888                 }
6889                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6890 #if defined(VMS)
6891                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6892 #else /* ! VMS */
6893                     hv_clear(GvHV(gv));
6894 #  if defined(USE_ENVIRON_ARRAY)
6895                     if (gv == PL_envgv)
6896                         my_clearenv();
6897 #  endif /* USE_ENVIRON_ARRAY */
6898 #endif /* VMS */
6899                 }
6900             }
6901         }
6902     }
6903 }
6904
6905 /*
6906 =for apidoc sv_2io
6907
6908 Using various gambits, try to get an IO from an SV: the IO slot if its a
6909 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6910 named after the PV if we're a string.
6911
6912 =cut
6913 */
6914
6915 IO*
6916 Perl_sv_2io(pTHX_ SV *sv)
6917 {
6918     IO* io;
6919     GV* gv;
6920
6921     switch (SvTYPE(sv)) {
6922     case SVt_PVIO:
6923         io = (IO*)sv;
6924         break;
6925     case SVt_PVGV:
6926         gv = (GV*)sv;
6927         io = GvIO(gv);
6928         if (!io)
6929             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6930         break;
6931     default:
6932         if (!SvOK(sv))
6933             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6934         if (SvROK(sv))
6935             return sv_2io(SvRV(sv));
6936         gv = gv_fetchsv(sv, FALSE, SVt_PVIO);
6937         if (gv)
6938             io = GvIO(gv);
6939         else
6940             io = 0;
6941         if (!io)
6942             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6943         break;
6944     }
6945     return io;
6946 }
6947
6948 /*
6949 =for apidoc sv_2cv
6950
6951 Using various gambits, try to get a CV from an SV; in addition, try if
6952 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6953
6954 =cut
6955 */
6956
6957 CV *
6958 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6959 {
6960     dVAR;
6961     GV *gv = Nullgv;
6962     CV *cv = Nullcv;
6963
6964     if (!sv)
6965         return *gvp = Nullgv, Nullcv;
6966     switch (SvTYPE(sv)) {
6967     case SVt_PVCV:
6968         *st = CvSTASH(sv);
6969         *gvp = Nullgv;
6970         return (CV*)sv;
6971     case SVt_PVHV:
6972     case SVt_PVAV:
6973         *gvp = Nullgv;
6974         return Nullcv;
6975     case SVt_PVGV:
6976         gv = (GV*)sv;
6977         *gvp = gv;
6978         *st = GvESTASH(gv);
6979         goto fix_gv;
6980
6981     default:
6982         SvGETMAGIC(sv);
6983         if (SvROK(sv)) {
6984             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6985             tryAMAGICunDEREF(to_cv);
6986
6987             sv = SvRV(sv);
6988             if (SvTYPE(sv) == SVt_PVCV) {
6989                 cv = (CV*)sv;
6990                 *gvp = Nullgv;
6991                 *st = CvSTASH(cv);
6992                 return cv;
6993             }
6994             else if(isGV(sv))
6995                 gv = (GV*)sv;
6996             else
6997                 Perl_croak(aTHX_ "Not a subroutine reference");
6998         }
6999         else if (isGV(sv))
7000             gv = (GV*)sv;
7001         else
7002             gv = gv_fetchsv(sv, lref, SVt_PVCV);
7003         *gvp = gv;
7004         if (!gv)
7005             return Nullcv;
7006         *st = GvESTASH(gv);
7007     fix_gv:
7008         if (lref && !GvCVu(gv)) {
7009             SV *tmpsv;
7010             ENTER;
7011             tmpsv = NEWSV(704,0);
7012             gv_efullname3(tmpsv, gv, Nullch);
7013             /* XXX this is probably not what they think they're getting.
7014              * It has the same effect as "sub name;", i.e. just a forward
7015              * declaration! */
7016             newSUB(start_subparse(FALSE, 0),
7017                    newSVOP(OP_CONST, 0, tmpsv),
7018                    Nullop,
7019                    Nullop);
7020             LEAVE;
7021             if (!GvCVu(gv))
7022                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
7023                            sv);
7024         }
7025         return GvCVu(gv);
7026     }
7027 }
7028
7029 /*
7030 =for apidoc sv_true
7031
7032 Returns true if the SV has a true value by Perl's rules.
7033 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
7034 instead use an in-line version.
7035
7036 =cut
7037 */
7038
7039 I32
7040 Perl_sv_true(pTHX_ register SV *sv)
7041 {
7042     if (!sv)
7043         return 0;
7044     if (SvPOK(sv)) {
7045         register const XPV* const tXpv = (XPV*)SvANY(sv);
7046         if (tXpv &&
7047                 (tXpv->xpv_cur > 1 ||
7048                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
7049             return 1;
7050         else
7051             return 0;
7052     }
7053     else {
7054         if (SvIOK(sv))
7055             return SvIVX(sv) != 0;
7056         else {
7057             if (SvNOK(sv))
7058                 return SvNVX(sv) != 0.0;
7059             else
7060                 return sv_2bool(sv);
7061         }
7062     }
7063 }
7064
7065 /*
7066 =for apidoc sv_pvn_force
7067
7068 Get a sensible string out of the SV somehow.
7069 A private implementation of the C<SvPV_force> macro for compilers which
7070 can't cope with complex macro expressions. Always use the macro instead.
7071
7072 =for apidoc sv_pvn_force_flags
7073
7074 Get a sensible string out of the SV somehow.
7075 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
7076 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
7077 implemented in terms of this function.
7078 You normally want to use the various wrapper macros instead: see
7079 C<SvPV_force> and C<SvPV_force_nomg>
7080
7081 =cut
7082 */
7083
7084 char *
7085 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
7086 {
7087
7088     if (SvTHINKFIRST(sv) && !SvROK(sv))
7089         sv_force_normal_flags(sv, 0);
7090
7091     if (SvPOK(sv)) {
7092         if (lp)
7093             *lp = SvCUR(sv);
7094     }
7095     else {
7096         char *s;
7097         STRLEN len;
7098  
7099         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
7100             const char * const ref = sv_reftype(sv,0);
7101             if (PL_op)
7102                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
7103                            ref, OP_NAME(PL_op));
7104             else
7105                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
7106         }
7107         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
7108             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
7109                 OP_NAME(PL_op));
7110         s = sv_2pv_flags(sv, &len, flags);
7111         if (lp)
7112             *lp = len;
7113
7114         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
7115             if (SvROK(sv))
7116                 sv_unref(sv);
7117             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
7118             SvGROW(sv, len + 1);
7119             Move(s,SvPVX(sv),len,char);
7120             SvCUR_set(sv, len);
7121             *SvEND(sv) = '\0';
7122         }
7123         if (!SvPOK(sv)) {
7124             SvPOK_on(sv);               /* validate pointer */
7125             SvTAINT(sv);
7126             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
7127                                   PTR2UV(sv),SvPVX_const(sv)));
7128         }
7129     }
7130     return SvPVX_mutable(sv);
7131 }
7132
7133 /*
7134 =for apidoc sv_pvbyten_force
7135
7136 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
7137
7138 =cut
7139 */
7140
7141 char *
7142 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
7143 {
7144     sv_pvn_force(sv,lp);
7145     sv_utf8_downgrade(sv,0);
7146     *lp = SvCUR(sv);
7147     return SvPVX(sv);
7148 }
7149
7150 /*
7151 =for apidoc sv_pvutf8n_force
7152
7153 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
7154
7155 =cut
7156 */
7157
7158 char *
7159 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
7160 {
7161     sv_pvn_force(sv,lp);
7162     sv_utf8_upgrade(sv);
7163     *lp = SvCUR(sv);
7164     return SvPVX(sv);
7165 }
7166
7167 /*
7168 =for apidoc sv_reftype
7169
7170 Returns a string describing what the SV is a reference to.
7171
7172 =cut
7173 */
7174
7175 char *
7176 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
7177 {
7178     /* The fact that I don't need to downcast to char * everywhere, only in ?:
7179        inside return suggests a const propagation bug in g++.  */
7180     if (ob && SvOBJECT(sv)) {
7181         char * const name = HvNAME_get(SvSTASH(sv));
7182         return name ? name : (char *) "__ANON__";
7183     }
7184     else {
7185         switch (SvTYPE(sv)) {
7186         case SVt_NULL:
7187         case SVt_IV:
7188         case SVt_NV:
7189         case SVt_RV:
7190         case SVt_PV:
7191         case SVt_PVIV:
7192         case SVt_PVNV:
7193         case SVt_PVMG:
7194         case SVt_PVBM:
7195                                 if (SvVOK(sv))
7196                                     return "VSTRING";
7197                                 if (SvROK(sv))
7198                                     return "REF";
7199                                 else
7200                                     return "SCALAR";
7201
7202         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
7203                                 /* tied lvalues should appear to be
7204                                  * scalars for backwards compatitbility */
7205                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
7206                                     ? "SCALAR" : "LVALUE");
7207         case SVt_PVAV:          return "ARRAY";
7208         case SVt_PVHV:          return "HASH";
7209         case SVt_PVCV:          return "CODE";
7210         case SVt_PVGV:          return "GLOB";
7211         case SVt_PVFM:          return "FORMAT";
7212         case SVt_PVIO:          return "IO";
7213         default:                return "UNKNOWN";
7214         }
7215     }
7216 }
7217
7218 /*
7219 =for apidoc sv_isobject
7220
7221 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7222 object.  If the SV is not an RV, or if the object is not blessed, then this
7223 will return false.
7224
7225 =cut
7226 */
7227
7228 int
7229 Perl_sv_isobject(pTHX_ SV *sv)
7230 {
7231     if (!sv)
7232         return 0;
7233     SvGETMAGIC(sv);
7234     if (!SvROK(sv))
7235         return 0;
7236     sv = (SV*)SvRV(sv);
7237     if (!SvOBJECT(sv))
7238         return 0;
7239     return 1;
7240 }
7241
7242 /*
7243 =for apidoc sv_isa
7244
7245 Returns a boolean indicating whether the SV is blessed into the specified
7246 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7247 an inheritance relationship.
7248
7249 =cut
7250 */
7251
7252 int
7253 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7254 {
7255     const char *hvname;
7256     if (!sv)
7257         return 0;
7258     SvGETMAGIC(sv);
7259     if (!SvROK(sv))
7260         return 0;
7261     sv = (SV*)SvRV(sv);
7262     if (!SvOBJECT(sv))
7263         return 0;
7264     hvname = HvNAME_get(SvSTASH(sv));
7265     if (!hvname)
7266         return 0;
7267
7268     return strEQ(hvname, name);
7269 }
7270
7271 /*
7272 =for apidoc newSVrv
7273
7274 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7275 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7276 be blessed in the specified package.  The new SV is returned and its
7277 reference count is 1.
7278
7279 =cut
7280 */
7281
7282 SV*
7283 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7284 {
7285     SV *sv;
7286
7287     new_SV(sv);
7288
7289     SV_CHECK_THINKFIRST_COW_DROP(rv);
7290     SvAMAGIC_off(rv);
7291
7292     if (SvTYPE(rv) >= SVt_PVMG) {
7293         const U32 refcnt = SvREFCNT(rv);
7294         SvREFCNT(rv) = 0;
7295         sv_clear(rv);
7296         SvFLAGS(rv) = 0;
7297         SvREFCNT(rv) = refcnt;
7298     }
7299
7300     if (SvTYPE(rv) < SVt_RV)
7301         sv_upgrade(rv, SVt_RV);
7302     else if (SvTYPE(rv) > SVt_RV) {
7303         SvPV_free(rv);
7304         SvCUR_set(rv, 0);
7305         SvLEN_set(rv, 0);
7306     }
7307
7308     SvOK_off(rv);
7309     SvRV_set(rv, sv);
7310     SvROK_on(rv);
7311
7312     if (classname) {
7313         HV* const stash = gv_stashpv(classname, TRUE);
7314         (void)sv_bless(rv, stash);
7315     }
7316     return sv;
7317 }
7318
7319 /*
7320 =for apidoc sv_setref_pv
7321
7322 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7323 argument will be upgraded to an RV.  That RV will be modified to point to
7324 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7325 into the SV.  The C<classname> argument indicates the package for the
7326 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7327 will have a reference count of 1, and the RV will be returned.
7328
7329 Do not use with other Perl types such as HV, AV, SV, CV, because those
7330 objects will become corrupted by the pointer copy process.
7331
7332 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7333
7334 =cut
7335 */
7336
7337 SV*
7338 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7339 {
7340     if (!pv) {
7341         sv_setsv(rv, &PL_sv_undef);
7342         SvSETMAGIC(rv);
7343     }
7344     else
7345         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7346     return rv;
7347 }
7348
7349 /*
7350 =for apidoc sv_setref_iv
7351
7352 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7353 argument will be upgraded to an RV.  That RV will be modified to point to
7354 the new SV.  The C<classname> argument indicates the package for the
7355 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7356 will have a reference count of 1, and the RV will be returned.
7357
7358 =cut
7359 */
7360
7361 SV*
7362 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7363 {
7364     sv_setiv(newSVrv(rv,classname), iv);
7365     return rv;
7366 }
7367
7368 /*
7369 =for apidoc sv_setref_uv
7370
7371 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7372 argument will be upgraded to an RV.  That RV will be modified to point to
7373 the new SV.  The C<classname> argument indicates the package for the
7374 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7375 will have a reference count of 1, and the RV will be returned.
7376
7377 =cut
7378 */
7379
7380 SV*
7381 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7382 {
7383     sv_setuv(newSVrv(rv,classname), uv);
7384     return rv;
7385 }
7386
7387 /*
7388 =for apidoc sv_setref_nv
7389
7390 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7391 argument will be upgraded to an RV.  That RV will be modified to point to
7392 the new SV.  The C<classname> argument indicates the package for the
7393 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7394 will have a reference count of 1, and the RV will be returned.
7395
7396 =cut
7397 */
7398
7399 SV*
7400 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7401 {
7402     sv_setnv(newSVrv(rv,classname), nv);
7403     return rv;
7404 }
7405
7406 /*
7407 =for apidoc sv_setref_pvn
7408
7409 Copies a string into a new SV, optionally blessing the SV.  The length of the
7410 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7411 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7412 argument indicates the package for the blessing.  Set C<classname> to
7413 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7414 of 1, and the RV will be returned.
7415
7416 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7417
7418 =cut
7419 */
7420
7421 SV*
7422 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7423 {
7424     sv_setpvn(newSVrv(rv,classname), pv, n);
7425     return rv;
7426 }
7427
7428 /*
7429 =for apidoc sv_bless
7430
7431 Blesses an SV into a specified package.  The SV must be an RV.  The package
7432 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7433 of the SV is unaffected.
7434
7435 =cut
7436 */
7437
7438 SV*
7439 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7440 {
7441     SV *tmpRef;
7442     if (!SvROK(sv))
7443         Perl_croak(aTHX_ "Can't bless non-reference value");
7444     tmpRef = SvRV(sv);
7445     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7446         if (SvREADONLY(tmpRef))
7447             Perl_croak(aTHX_ PL_no_modify);
7448         if (SvOBJECT(tmpRef)) {
7449             if (SvTYPE(tmpRef) != SVt_PVIO)
7450                 --PL_sv_objcount;
7451             SvREFCNT_dec(SvSTASH(tmpRef));
7452         }
7453     }
7454     SvOBJECT_on(tmpRef);
7455     if (SvTYPE(tmpRef) != SVt_PVIO)
7456         ++PL_sv_objcount;
7457     SvUPGRADE(tmpRef, SVt_PVMG);
7458     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7459
7460     if (Gv_AMG(stash))
7461         SvAMAGIC_on(sv);
7462     else
7463         SvAMAGIC_off(sv);
7464
7465     if(SvSMAGICAL(tmpRef))
7466         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7467             mg_set(tmpRef);
7468
7469
7470
7471     return sv;
7472 }
7473
7474 /* Downgrades a PVGV to a PVMG.
7475  */
7476
7477 STATIC void
7478 S_sv_unglob(pTHX_ SV *sv)
7479 {
7480     void *xpvmg;
7481
7482     assert(SvTYPE(sv) == SVt_PVGV);
7483     SvFAKE_off(sv);
7484     if (GvGP(sv))
7485         gp_free((GV*)sv);
7486     if (GvSTASH(sv)) {
7487         sv_del_backref((SV*)GvSTASH(sv), sv);
7488         GvSTASH(sv) = Nullhv;
7489     }
7490     sv_unmagic(sv, PERL_MAGIC_glob);
7491     Safefree(GvNAME(sv));
7492     GvMULTI_off(sv);
7493
7494     /* need to keep SvANY(sv) in the right arena */
7495     xpvmg = new_XPVMG();
7496     StructCopy(SvANY(sv), xpvmg, XPVMG);
7497     del_XPVGV(SvANY(sv));
7498     SvANY(sv) = xpvmg;
7499
7500     SvFLAGS(sv) &= ~SVTYPEMASK;
7501     SvFLAGS(sv) |= SVt_PVMG;
7502 }
7503
7504 /*
7505 =for apidoc sv_unref_flags
7506
7507 Unsets the RV status of the SV, and decrements the reference count of
7508 whatever was being referenced by the RV.  This can almost be thought of
7509 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7510 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7511 (otherwise the decrementing is conditional on the reference count being
7512 different from one or the reference being a readonly SV).
7513 See C<SvROK_off>.
7514
7515 =cut
7516 */
7517
7518 void
7519 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7520 {
7521     SV* const target = SvRV(ref);
7522
7523     if (SvWEAKREF(ref)) {
7524         sv_del_backref(target, ref);
7525         SvWEAKREF_off(ref);
7526         SvRV_set(ref, NULL);
7527         return;
7528     }
7529     SvRV_set(ref, NULL);
7530     SvROK_off(ref);
7531     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7532        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7533     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7534         SvREFCNT_dec(target);
7535     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7536         sv_2mortal(target);     /* Schedule for freeing later */
7537 }
7538
7539 /*
7540 =for apidoc sv_untaint
7541
7542 Untaint an SV. Use C<SvTAINTED_off> instead.
7543 =cut
7544 */
7545
7546 void
7547 Perl_sv_untaint(pTHX_ SV *sv)
7548 {
7549     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7550         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7551         if (mg)
7552             mg->mg_len &= ~1;
7553     }
7554 }
7555
7556 /*
7557 =for apidoc sv_tainted
7558
7559 Test an SV for taintedness. Use C<SvTAINTED> instead.
7560 =cut
7561 */
7562
7563 bool
7564 Perl_sv_tainted(pTHX_ SV *sv)
7565 {
7566     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7567         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7568         if (mg && (mg->mg_len & 1) )
7569             return TRUE;
7570     }
7571     return FALSE;
7572 }
7573
7574 /*
7575 =for apidoc sv_setpviv
7576
7577 Copies an integer into the given SV, also updating its string value.
7578 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7579
7580 =cut
7581 */
7582
7583 void
7584 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7585 {
7586     char buf[TYPE_CHARS(UV)];
7587     char *ebuf;
7588     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7589
7590     sv_setpvn(sv, ptr, ebuf - ptr);
7591 }
7592
7593 /*
7594 =for apidoc sv_setpviv_mg
7595
7596 Like C<sv_setpviv>, but also handles 'set' magic.
7597
7598 =cut
7599 */
7600
7601 void
7602 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7603 {
7604     sv_setpviv(sv, iv);
7605     SvSETMAGIC(sv);
7606 }
7607
7608 #if defined(PERL_IMPLICIT_CONTEXT)
7609
7610 /* pTHX_ magic can't cope with varargs, so this is a no-context
7611  * version of the main function, (which may itself be aliased to us).
7612  * Don't access this version directly.
7613  */
7614
7615 void
7616 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7617 {
7618     dTHX;
7619     va_list args;
7620     va_start(args, pat);
7621     sv_vsetpvf(sv, pat, &args);
7622     va_end(args);
7623 }
7624
7625 /* pTHX_ magic can't cope with varargs, so this is a no-context
7626  * version of the main function, (which may itself be aliased to us).
7627  * Don't access this version directly.
7628  */
7629
7630 void
7631 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7632 {
7633     dTHX;
7634     va_list args;
7635     va_start(args, pat);
7636     sv_vsetpvf_mg(sv, pat, &args);
7637     va_end(args);
7638 }
7639 #endif
7640
7641 /*
7642 =for apidoc sv_setpvf
7643
7644 Works like C<sv_catpvf> but copies the text into the SV instead of
7645 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7646
7647 =cut
7648 */
7649
7650 void
7651 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7652 {
7653     va_list args;
7654     va_start(args, pat);
7655     sv_vsetpvf(sv, pat, &args);
7656     va_end(args);
7657 }
7658
7659 /*
7660 =for apidoc sv_vsetpvf
7661
7662 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7663 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7664
7665 Usually used via its frontend C<sv_setpvf>.
7666
7667 =cut
7668 */
7669
7670 void
7671 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7672 {
7673     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7674 }
7675
7676 /*
7677 =for apidoc sv_setpvf_mg
7678
7679 Like C<sv_setpvf>, but also handles 'set' magic.
7680
7681 =cut
7682 */
7683
7684 void
7685 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7686 {
7687     va_list args;
7688     va_start(args, pat);
7689     sv_vsetpvf_mg(sv, pat, &args);
7690     va_end(args);
7691 }
7692
7693 /*
7694 =for apidoc sv_vsetpvf_mg
7695
7696 Like C<sv_vsetpvf>, but also handles 'set' magic.
7697
7698 Usually used via its frontend C<sv_setpvf_mg>.
7699
7700 =cut
7701 */
7702
7703 void
7704 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7705 {
7706     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7707     SvSETMAGIC(sv);
7708 }
7709
7710 #if defined(PERL_IMPLICIT_CONTEXT)
7711
7712 /* pTHX_ magic can't cope with varargs, so this is a no-context
7713  * version of the main function, (which may itself be aliased to us).
7714  * Don't access this version directly.
7715  */
7716
7717 void
7718 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7719 {
7720     dTHX;
7721     va_list args;
7722     va_start(args, pat);
7723     sv_vcatpvf(sv, pat, &args);
7724     va_end(args);
7725 }
7726
7727 /* pTHX_ magic can't cope with varargs, so this is a no-context
7728  * version of the main function, (which may itself be aliased to us).
7729  * Don't access this version directly.
7730  */
7731
7732 void
7733 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7734 {
7735     dTHX;
7736     va_list args;
7737     va_start(args, pat);
7738     sv_vcatpvf_mg(sv, pat, &args);
7739     va_end(args);
7740 }
7741 #endif
7742
7743 /*
7744 =for apidoc sv_catpvf
7745
7746 Processes its arguments like C<sprintf> and appends the formatted
7747 output to an SV.  If the appended data contains "wide" characters
7748 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7749 and characters >255 formatted with %c), the original SV might get
7750 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7751 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7752 valid UTF-8; if the original SV was bytes, the pattern should be too.
7753
7754 =cut */
7755
7756 void
7757 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7758 {
7759     va_list args;
7760     va_start(args, pat);
7761     sv_vcatpvf(sv, pat, &args);
7762     va_end(args);
7763 }
7764
7765 /*
7766 =for apidoc sv_vcatpvf
7767
7768 Processes its arguments like C<vsprintf> and appends the formatted output
7769 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7770
7771 Usually used via its frontend C<sv_catpvf>.
7772
7773 =cut
7774 */
7775
7776 void
7777 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7778 {
7779     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7780 }
7781
7782 /*
7783 =for apidoc sv_catpvf_mg
7784
7785 Like C<sv_catpvf>, but also handles 'set' magic.
7786
7787 =cut
7788 */
7789
7790 void
7791 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7792 {
7793     va_list args;
7794     va_start(args, pat);
7795     sv_vcatpvf_mg(sv, pat, &args);
7796     va_end(args);
7797 }
7798
7799 /*
7800 =for apidoc sv_vcatpvf_mg
7801
7802 Like C<sv_vcatpvf>, but also handles 'set' magic.
7803
7804 Usually used via its frontend C<sv_catpvf_mg>.
7805
7806 =cut
7807 */
7808
7809 void
7810 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7811 {
7812     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7813     SvSETMAGIC(sv);
7814 }
7815
7816 /*
7817 =for apidoc sv_vsetpvfn
7818
7819 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7820 appending it.
7821
7822 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7823
7824 =cut
7825 */
7826
7827 void
7828 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7829 {
7830     sv_setpvn(sv, "", 0);
7831     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7832 }
7833
7834 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7835
7836 STATIC I32
7837 S_expect_number(pTHX_ char** pattern)
7838 {
7839     I32 var = 0;
7840     switch (**pattern) {
7841     case '1': case '2': case '3':
7842     case '4': case '5': case '6':
7843     case '7': case '8': case '9':
7844         while (isDIGIT(**pattern))
7845             var = var * 10 + (*(*pattern)++ - '0');
7846     }
7847     return var;
7848 }
7849 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7850
7851 static char *
7852 F0convert(NV nv, char *endbuf, STRLEN *len)
7853 {
7854     const int neg = nv < 0;
7855     UV uv;
7856
7857     if (neg)
7858         nv = -nv;
7859     if (nv < UV_MAX) {
7860         char *p = endbuf;
7861         nv += 0.5;
7862         uv = (UV)nv;
7863         if (uv & 1 && uv == nv)
7864             uv--;                       /* Round to even */
7865         do {
7866             const unsigned dig = uv % 10;
7867             *--p = '0' + dig;
7868         } while (uv /= 10);
7869         if (neg)
7870             *--p = '-';
7871         *len = endbuf - p;
7872         return p;
7873     }
7874     return Nullch;
7875 }
7876
7877
7878 /*
7879 =for apidoc sv_vcatpvfn
7880
7881 Processes its arguments like C<vsprintf> and appends the formatted output
7882 to an SV.  Uses an array of SVs if the C style variable argument list is
7883 missing (NULL).  When running with taint checks enabled, indicates via
7884 C<maybe_tainted> if results are untrustworthy (often due to the use of
7885 locales).
7886
7887 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7888
7889 =cut
7890 */
7891
7892
7893 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7894                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7895                         vec_utf8 = DO_UTF8(vecsv);
7896
7897 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7898
7899 void
7900 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7901 {
7902     char *p;
7903     char *q;
7904     const char *patend;
7905     STRLEN origlen;
7906     I32 svix = 0;
7907     static const char nullstr[] = "(null)";
7908     SV *argsv = Nullsv;
7909     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7910     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7911     SV *nsv = Nullsv;
7912     /* Times 4: a decimal digit takes more than 3 binary digits.
7913      * NV_DIG: mantissa takes than many decimal digits.
7914      * Plus 32: Playing safe. */
7915     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7916     /* large enough for "%#.#f" --chip */
7917     /* what about long double NVs? --jhi */
7918
7919     PERL_UNUSED_ARG(maybe_tainted);
7920
7921     /* no matter what, this is a string now */
7922     (void)SvPV_force(sv, origlen);
7923
7924     /* special-case "", "%s", and "%-p" (SVf - see below) */
7925     if (patlen == 0)
7926         return;
7927     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7928         if (args) {
7929             const char * const s = va_arg(*args, char*);
7930             sv_catpv(sv, s ? s : nullstr);
7931         }
7932         else if (svix < svmax) {
7933             sv_catsv(sv, *svargs);
7934         }
7935         return;
7936     }
7937     if (args && patlen == 3 && pat[0] == '%' &&
7938                 pat[1] == '-' && pat[2] == 'p') {
7939         argsv = va_arg(*args, SV*);
7940         sv_catsv(sv, argsv);
7941         return;
7942     }
7943
7944 #ifndef USE_LONG_DOUBLE
7945     /* special-case "%.<number>[gf]" */
7946     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7947          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7948         unsigned digits = 0;
7949         const char *pp;
7950
7951         pp = pat + 2;
7952         while (*pp >= '0' && *pp <= '9')
7953             digits = 10 * digits + (*pp++ - '0');
7954         if (pp - pat == (int)patlen - 1) {
7955             NV nv;
7956
7957             if (svix < svmax)
7958                 nv = SvNV(*svargs);
7959             else
7960                 return;
7961             if (*pp == 'g') {
7962                 /* Add check for digits != 0 because it seems that some
7963                    gconverts are buggy in this case, and we don't yet have
7964                    a Configure test for this.  */
7965                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7966                      /* 0, point, slack */
7967                     Gconvert(nv, (int)digits, 0, ebuf);
7968                     sv_catpv(sv, ebuf);
7969                     if (*ebuf)  /* May return an empty string for digits==0 */
7970                         return;
7971                 }
7972             } else if (!digits) {
7973                 STRLEN l;
7974
7975                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7976                     sv_catpvn(sv, p, l);
7977                     return;
7978                 }
7979             }
7980         }
7981     }
7982 #endif /* !USE_LONG_DOUBLE */
7983
7984     if (!args && svix < svmax && DO_UTF8(*svargs))
7985         has_utf8 = TRUE;
7986
7987     patend = (char*)pat + patlen;
7988     for (p = (char*)pat; p < patend; p = q) {
7989         bool alt = FALSE;
7990         bool left = FALSE;
7991         bool vectorize = FALSE;
7992         bool vectorarg = FALSE;
7993         bool vec_utf8 = FALSE;
7994         char fill = ' ';
7995         char plus = 0;
7996         char intsize = 0;
7997         STRLEN width = 0;
7998         STRLEN zeros = 0;
7999         bool has_precis = FALSE;
8000         STRLEN precis = 0;
8001         I32 osvix = svix;
8002         bool is_utf8 = FALSE;  /* is this item utf8?   */
8003 #ifdef HAS_LDBL_SPRINTF_BUG
8004         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8005            with sfio - Allen <allens@cpan.org> */
8006         bool fix_ldbl_sprintf_bug = FALSE;
8007 #endif
8008
8009         char esignbuf[4];
8010         U8 utf8buf[UTF8_MAXBYTES+1];
8011         STRLEN esignlen = 0;
8012
8013         const char *eptr = Nullch;
8014         STRLEN elen = 0;
8015         SV *vecsv = Nullsv;
8016         const U8 *vecstr = Null(U8*);
8017         STRLEN veclen = 0;
8018         char c = 0;
8019         int i;
8020         unsigned base = 0;
8021         IV iv = 0;
8022         UV uv = 0;
8023         /* we need a long double target in case HAS_LONG_DOUBLE but
8024            not USE_LONG_DOUBLE
8025         */
8026 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
8027         long double nv;
8028 #else
8029         NV nv;
8030 #endif
8031         STRLEN have;
8032         STRLEN need;
8033         STRLEN gap;
8034         const char *dotstr = ".";
8035         STRLEN dotstrlen = 1;
8036         I32 efix = 0; /* explicit format parameter index */
8037         I32 ewix = 0; /* explicit width index */
8038         I32 epix = 0; /* explicit precision index */
8039         I32 evix = 0; /* explicit vector index */
8040         bool asterisk = FALSE;
8041
8042         /* echo everything up to the next format specification */
8043         for (q = p; q < patend && *q != '%'; ++q) ;
8044         if (q > p) {
8045             if (has_utf8 && !pat_utf8)
8046                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
8047             else
8048                 sv_catpvn(sv, p, q - p);
8049             p = q;
8050         }
8051         if (q++ >= patend)
8052             break;
8053
8054 /*
8055     We allow format specification elements in this order:
8056         \d+\$              explicit format parameter index
8057         [-+ 0#]+           flags
8058         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
8059         0                  flag (as above): repeated to allow "v02"     
8060         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
8061         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
8062         [hlqLV]            size
8063     [%bcdefginopsuxDFOUX] format (mandatory)
8064 */
8065
8066         if (args) {
8067 /*  
8068         As of perl5.9.3, printf format checking is on by default.
8069         Internally, perl uses %p formats to provide an escape to
8070         some extended formatting.  This block deals with those
8071         extensions: if it does not match, (char*)q is reset and
8072         the normal format processing code is used.
8073
8074         Currently defined extensions are:
8075                 %p              include pointer address (standard)      
8076                 %-p     (SVf)   include an SV (previously %_)
8077                 %-<num>p        include an SV with precision <num>      
8078                 %1p     (VDf)   include a v-string (as %vd)
8079                 %<num>p         reserved for future extensions
8080
8081         Robin Barker 2005-07-14
8082 */
8083             char* r = q; 
8084             bool sv = FALSE;    
8085             STRLEN n = 0;
8086             if (*q == '-')
8087                 sv = *q++;
8088             EXPECT_NUMBER(q, n);
8089             if (*q++ == 'p') {
8090                 if (sv) {                       /* SVf */
8091                     if (n) {
8092                         precis = n;
8093                         has_precis = TRUE;
8094                     }
8095                     argsv = va_arg(*args, SV*);
8096                     eptr = SvPVx_const(argsv, elen);
8097                     if (DO_UTF8(argsv))
8098                         is_utf8 = TRUE;
8099                     goto string;
8100                 }
8101 #if vdNUMBER
8102                 else if (n == vdNUMBER) {       /* VDf */
8103                     vectorize = TRUE;
8104                     VECTORIZE_ARGS
8105                     goto format_vd;
8106                 }
8107 #endif
8108                 else if (n) {
8109                     if (ckWARN_d(WARN_INTERNAL))
8110                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
8111                         "internal %%<num>p might conflict with future printf extensions");
8112                 }
8113             }
8114             q = r; 
8115         }
8116
8117         if (EXPECT_NUMBER(q, width)) {
8118             if (*q == '$') {
8119                 ++q;
8120                 efix = width;
8121             } else {
8122                 goto gotwidth;
8123             }
8124         }
8125
8126         /* FLAGS */
8127
8128         while (*q) {
8129             switch (*q) {
8130             case ' ':
8131             case '+':
8132                 plus = *q++;
8133                 continue;
8134
8135             case '-':
8136                 left = TRUE;
8137                 q++;
8138                 continue;
8139
8140             case '0':
8141                 fill = *q++;
8142                 continue;
8143
8144             case '#':
8145                 alt = TRUE;
8146                 q++;
8147                 continue;
8148
8149             default:
8150                 break;
8151             }
8152             break;
8153         }
8154
8155       tryasterisk:
8156         if (*q == '*') {
8157             q++;
8158             if (EXPECT_NUMBER(q, ewix))
8159                 if (*q++ != '$')
8160                     goto unknown;
8161             asterisk = TRUE;
8162         }
8163         if (*q == 'v') {
8164             q++;
8165             if (vectorize)
8166                 goto unknown;
8167             if ((vectorarg = asterisk)) {
8168                 evix = ewix;
8169                 ewix = 0;
8170                 asterisk = FALSE;
8171             }
8172             vectorize = TRUE;
8173             goto tryasterisk;
8174         }
8175
8176         if (!asterisk)
8177         {
8178             if( *q == '0' )
8179                 fill = *q++;
8180             EXPECT_NUMBER(q, width);
8181         }
8182
8183         if (vectorize) {
8184             if (vectorarg) {
8185                 if (args)
8186                     vecsv = va_arg(*args, SV*);
8187                 else
8188                     vecsv = (evix ? evix <= svmax : svix < svmax) ?
8189                         svargs[evix ? evix-1 : svix++] : &PL_sv_undef;
8190                 dotstr = SvPV_const(vecsv, dotstrlen);
8191                 if (DO_UTF8(vecsv))
8192                     is_utf8 = TRUE;
8193             }
8194             if (args) {
8195                 VECTORIZE_ARGS
8196             }
8197             else if (efix ? efix <= svmax : svix < svmax) {
8198                 vecsv = svargs[efix ? efix-1 : svix++];
8199                 vecstr = (U8*)SvPV_const(vecsv,veclen);
8200                 vec_utf8 = DO_UTF8(vecsv);
8201                 /* if this is a version object, we need to return the
8202                  * stringified representation (which the SvPVX_const has
8203                  * already done for us), but not vectorize the args
8204                  */
8205                 if ( *q == 'd' && sv_derived_from(vecsv,"version") )
8206                 {
8207                         q++; /* skip past the rest of the %vd format */
8208                         eptr = (const char *) vecstr;
8209                         elen = veclen;
8210                         vectorize=FALSE;
8211                         goto string;
8212                 }
8213             }
8214             else {
8215                 vecstr = (U8*)"";
8216                 veclen = 0;
8217             }
8218         }
8219
8220         if (asterisk) {
8221             if (args)
8222                 i = va_arg(*args, int);
8223             else
8224                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8225                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8226             left |= (i < 0);
8227             width = (i < 0) ? -i : i;
8228         }
8229       gotwidth:
8230
8231         /* PRECISION */
8232
8233         if (*q == '.') {
8234             q++;
8235             if (*q == '*') {
8236                 q++;
8237                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8238                     goto unknown;
8239                 /* XXX: todo, support specified precision parameter */
8240                 if (epix)
8241                     goto unknown;
8242                 if (args)
8243                     i = va_arg(*args, int);
8244                 else
8245                     i = (ewix ? ewix <= svmax : svix < svmax)
8246                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8247                 precis = (i < 0) ? 0 : i;
8248             }
8249             else {
8250                 precis = 0;
8251                 while (isDIGIT(*q))
8252                     precis = precis * 10 + (*q++ - '0');
8253             }
8254             has_precis = TRUE;
8255         }
8256
8257         /* SIZE */
8258
8259         switch (*q) {
8260 #ifdef WIN32
8261         case 'I':                       /* Ix, I32x, and I64x */
8262 #  ifdef WIN64
8263             if (q[1] == '6' && q[2] == '4') {
8264                 q += 3;
8265                 intsize = 'q';
8266                 break;
8267             }
8268 #  endif
8269             if (q[1] == '3' && q[2] == '2') {
8270                 q += 3;
8271                 break;
8272             }
8273 #  ifdef WIN64
8274             intsize = 'q';
8275 #  endif
8276             q++;
8277             break;
8278 #endif
8279 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8280         case 'L':                       /* Ld */
8281             /* FALL THROUGH */
8282 #ifdef HAS_QUAD
8283         case 'q':                       /* qd */
8284 #endif
8285             intsize = 'q';
8286             q++;
8287             break;
8288 #endif
8289         case 'l':
8290 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8291             if (*(q + 1) == 'l') {      /* lld, llf */
8292                 intsize = 'q';
8293                 q += 2;
8294                 break;
8295              }
8296 #endif
8297             /* FALL THROUGH */
8298         case 'h':
8299             /* FALL THROUGH */
8300         case 'V':
8301             intsize = *q++;
8302             break;
8303         }
8304
8305         /* CONVERSION */
8306
8307         if (*q == '%') {
8308             eptr = q++;
8309             elen = 1;
8310             goto string;
8311         }
8312
8313         if (vectorize)
8314             argsv = vecsv;
8315         else if (!args) {
8316             if (efix) {
8317                 const I32 i = efix-1;
8318                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8319             } else {
8320                 argsv = (svix >= 0 && svix < svmax)
8321                     ? svargs[svix++] : &PL_sv_undef;
8322             }
8323         }
8324
8325         switch (c = *q++) {
8326
8327             /* STRINGS */
8328
8329         case 'c':
8330             uv = (args && !vectorize) ? va_arg(*args, int) : SvIVx(argsv);
8331             if ((uv > 255 ||
8332                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8333                 && !IN_BYTES) {
8334                 eptr = (char*)utf8buf;
8335                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8336                 is_utf8 = TRUE;
8337             }
8338             else {
8339                 c = (char)uv;
8340                 eptr = &c;
8341                 elen = 1;
8342             }
8343             goto string;
8344
8345         case 's':
8346             if (args && !vectorize) {
8347                 eptr = va_arg(*args, char*);
8348                 if (eptr)
8349 #ifdef MACOS_TRADITIONAL
8350                   /* On MacOS, %#s format is used for Pascal strings */
8351                   if (alt)
8352                     elen = *eptr++;
8353                   else
8354 #endif
8355                     elen = strlen(eptr);
8356                 else {
8357                     eptr = (char *)nullstr;
8358                     elen = sizeof nullstr - 1;
8359                 }
8360             }
8361             else {
8362                 eptr = SvPVx_const(argsv, elen);
8363                 if (DO_UTF8(argsv)) {
8364                     if (has_precis && precis < elen) {
8365                         I32 p = precis;
8366                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8367                         precis = p;
8368                     }
8369                     if (width) { /* fudge width (can't fudge elen) */
8370                         width += elen - sv_len_utf8(argsv);
8371                     }
8372                     is_utf8 = TRUE;
8373                 }
8374             }
8375
8376         string:
8377             vectorize = FALSE;
8378             if (has_precis && elen > precis)
8379                 elen = precis;
8380             break;
8381
8382             /* INTEGERS */
8383
8384         case 'p':
8385             if (alt || vectorize)
8386                 goto unknown;
8387             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8388             base = 16;
8389             goto integer;
8390
8391         case 'D':
8392 #ifdef IV_IS_QUAD
8393             intsize = 'q';
8394 #else
8395             intsize = 'l';
8396 #endif
8397             /* FALL THROUGH */
8398         case 'd':
8399         case 'i':
8400 #if vdNUMBER
8401         format_vd:
8402 #endif
8403             if (vectorize) {
8404                 STRLEN ulen;
8405                 if (!veclen)
8406                     continue;
8407                 if (vec_utf8)
8408                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8409                                         UTF8_ALLOW_ANYUV);
8410                 else {
8411                     uv = *vecstr;
8412                     ulen = 1;
8413                 }
8414                 vecstr += ulen;
8415                 veclen -= ulen;
8416                 if (plus)
8417                      esignbuf[esignlen++] = plus;
8418             }
8419             else if (args) {
8420                 switch (intsize) {
8421                 case 'h':       iv = (short)va_arg(*args, int); break;
8422                 case 'l':       iv = va_arg(*args, long); break;
8423                 case 'V':       iv = va_arg(*args, IV); break;
8424                 default:        iv = va_arg(*args, int); break;
8425 #ifdef HAS_QUAD
8426                 case 'q':       iv = va_arg(*args, Quad_t); break;
8427 #endif
8428                 }
8429             }
8430             else {
8431                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8432                 switch (intsize) {
8433                 case 'h':       iv = (short)tiv; break;
8434                 case 'l':       iv = (long)tiv; break;
8435                 case 'V':
8436                 default:        iv = tiv; break;
8437 #ifdef HAS_QUAD
8438                 case 'q':       iv = (Quad_t)tiv; break;
8439 #endif
8440                 }
8441             }
8442             if ( !vectorize )   /* we already set uv above */
8443             {
8444                 if (iv >= 0) {
8445                     uv = iv;
8446                     if (plus)
8447                         esignbuf[esignlen++] = plus;
8448                 }
8449                 else {
8450                     uv = -iv;
8451                     esignbuf[esignlen++] = '-';
8452                 }
8453             }
8454             base = 10;
8455             goto integer;
8456
8457         case 'U':
8458 #ifdef IV_IS_QUAD
8459             intsize = 'q';
8460 #else
8461             intsize = 'l';
8462 #endif
8463             /* FALL THROUGH */
8464         case 'u':
8465             base = 10;
8466             goto uns_integer;
8467
8468         case 'b':
8469             base = 2;
8470             goto uns_integer;
8471
8472         case 'O':
8473 #ifdef IV_IS_QUAD
8474             intsize = 'q';
8475 #else
8476             intsize = 'l';
8477 #endif
8478             /* FALL THROUGH */
8479         case 'o':
8480             base = 8;
8481             goto uns_integer;
8482
8483         case 'X':
8484         case 'x':
8485             base = 16;
8486
8487         uns_integer:
8488             if (vectorize) {
8489                 STRLEN ulen;
8490         vector:
8491                 if (!veclen)
8492                     continue;
8493                 if (vec_utf8)
8494                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8495                                         UTF8_ALLOW_ANYUV);
8496                 else {
8497                     uv = *vecstr;
8498                     ulen = 1;
8499                 }
8500                 vecstr += ulen;
8501                 veclen -= ulen;
8502             }
8503             else if (args) {
8504                 switch (intsize) {
8505                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8506                 case 'l':  uv = va_arg(*args, unsigned long); break;
8507                 case 'V':  uv = va_arg(*args, UV); break;
8508                 default:   uv = va_arg(*args, unsigned); break;
8509 #ifdef HAS_QUAD
8510                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8511 #endif
8512                 }
8513             }
8514             else {
8515                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8516                 switch (intsize) {
8517                 case 'h':       uv = (unsigned short)tuv; break;
8518                 case 'l':       uv = (unsigned long)tuv; break;
8519                 case 'V':
8520                 default:        uv = tuv; break;
8521 #ifdef HAS_QUAD
8522                 case 'q':       uv = (Uquad_t)tuv; break;
8523 #endif
8524                 }
8525             }
8526
8527         integer:
8528             {
8529                 char *ptr = ebuf + sizeof ebuf;
8530                 switch (base) {
8531                     unsigned dig;
8532                 case 16:
8533                     if (!uv)
8534                         alt = FALSE;
8535                     p = (char*)((c == 'X')
8536                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8537                     do {
8538                         dig = uv & 15;
8539                         *--ptr = p[dig];
8540                     } while (uv >>= 4);
8541                     if (alt) {
8542                         esignbuf[esignlen++] = '0';
8543                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8544                     }
8545                     break;
8546                 case 8:
8547                     do {
8548                         dig = uv & 7;
8549                         *--ptr = '0' + dig;
8550                     } while (uv >>= 3);
8551                     if (alt && *ptr != '0')
8552                         *--ptr = '0';
8553                     break;
8554                 case 2:
8555                     if (!uv)
8556                         alt = FALSE;
8557                     do {
8558                         dig = uv & 1;
8559                         *--ptr = '0' + dig;
8560                     } while (uv >>= 1);
8561                     if (alt) {
8562                         esignbuf[esignlen++] = '0';
8563                         esignbuf[esignlen++] = 'b';
8564                     }
8565                     break;
8566                 default:                /* it had better be ten or less */
8567                     do {
8568                         dig = uv % base;
8569                         *--ptr = '0' + dig;
8570                     } while (uv /= base);
8571                     break;
8572                 }
8573                 elen = (ebuf + sizeof ebuf) - ptr;
8574                 eptr = ptr;
8575                 if (has_precis) {
8576                     if (precis > elen)
8577                         zeros = precis - elen;
8578                     else if (precis == 0 && elen == 1 && *eptr == '0')
8579                         elen = 0;
8580                 }
8581             }
8582             break;
8583
8584             /* FLOATING POINT */
8585
8586         case 'F':
8587             c = 'f';            /* maybe %F isn't supported here */
8588             /* FALL THROUGH */
8589         case 'e': case 'E':
8590         case 'f':
8591         case 'g': case 'G':
8592
8593             /* This is evil, but floating point is even more evil */
8594
8595             /* for SV-style calling, we can only get NV
8596                for C-style calling, we assume %f is double;
8597                for simplicity we allow any of %Lf, %llf, %qf for long double
8598             */
8599             switch (intsize) {
8600             case 'V':
8601 #if defined(USE_LONG_DOUBLE)
8602                 intsize = 'q';
8603 #endif
8604                 break;
8605 /* [perl #20339] - we should accept and ignore %lf rather than die */
8606             case 'l':
8607                 /* FALL THROUGH */
8608             default:
8609 #if defined(USE_LONG_DOUBLE)
8610                 intsize = args ? 0 : 'q';
8611 #endif
8612                 break;
8613             case 'q':
8614 #if defined(HAS_LONG_DOUBLE)
8615                 break;
8616 #else
8617                 /* FALL THROUGH */
8618 #endif
8619             case 'h':
8620                 goto unknown;
8621             }
8622
8623             /* now we need (long double) if intsize == 'q', else (double) */
8624             nv = (args && !vectorize) ?
8625 #if LONG_DOUBLESIZE > DOUBLESIZE
8626                 intsize == 'q' ?
8627                     va_arg(*args, long double) :
8628                     va_arg(*args, double)
8629 #else
8630                     va_arg(*args, double)
8631 #endif
8632                 : SvNVx(argsv);
8633
8634             need = 0;
8635             vectorize = FALSE;
8636             if (c != 'e' && c != 'E') {
8637                 i = PERL_INT_MIN;
8638                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8639                    will cast our (long double) to (double) */
8640                 (void)Perl_frexp(nv, &i);
8641                 if (i == PERL_INT_MIN)
8642                     Perl_die(aTHX_ "panic: frexp");
8643                 if (i > 0)
8644                     need = BIT_DIGITS(i);
8645             }
8646             need += has_precis ? precis : 6; /* known default */
8647
8648             if (need < width)
8649                 need = width;
8650
8651 #ifdef HAS_LDBL_SPRINTF_BUG
8652             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8653                with sfio - Allen <allens@cpan.org> */
8654
8655 #  ifdef DBL_MAX
8656 #    define MY_DBL_MAX DBL_MAX
8657 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8658 #    if DOUBLESIZE >= 8
8659 #      define MY_DBL_MAX 1.7976931348623157E+308L
8660 #    else
8661 #      define MY_DBL_MAX 3.40282347E+38L
8662 #    endif
8663 #  endif
8664
8665 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8666 #    define MY_DBL_MAX_BUG 1L
8667 #  else
8668 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8669 #  endif
8670
8671 #  ifdef DBL_MIN
8672 #    define MY_DBL_MIN DBL_MIN
8673 #  else  /* XXX guessing! -Allen */
8674 #    if DOUBLESIZE >= 8
8675 #      define MY_DBL_MIN 2.2250738585072014E-308L
8676 #    else
8677 #      define MY_DBL_MIN 1.17549435E-38L
8678 #    endif
8679 #  endif
8680
8681             if ((intsize == 'q') && (c == 'f') &&
8682                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8683                 (need < DBL_DIG)) {
8684                 /* it's going to be short enough that
8685                  * long double precision is not needed */
8686
8687                 if ((nv <= 0L) && (nv >= -0L))
8688                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8689                 else {
8690                     /* would use Perl_fp_class as a double-check but not
8691                      * functional on IRIX - see perl.h comments */
8692
8693                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8694                         /* It's within the range that a double can represent */
8695 #if defined(DBL_MAX) && !defined(DBL_MIN)
8696                         if ((nv >= ((long double)1/DBL_MAX)) ||
8697                             (nv <= (-(long double)1/DBL_MAX)))
8698 #endif
8699                         fix_ldbl_sprintf_bug = TRUE;
8700                     }
8701                 }
8702                 if (fix_ldbl_sprintf_bug == TRUE) {
8703                     double temp;
8704
8705                     intsize = 0;
8706                     temp = (double)nv;
8707                     nv = (NV)temp;
8708                 }
8709             }
8710
8711 #  undef MY_DBL_MAX
8712 #  undef MY_DBL_MAX_BUG
8713 #  undef MY_DBL_MIN
8714
8715 #endif /* HAS_LDBL_SPRINTF_BUG */
8716
8717             need += 20; /* fudge factor */
8718             if (PL_efloatsize < need) {
8719                 Safefree(PL_efloatbuf);
8720                 PL_efloatsize = need + 20; /* more fudge */
8721                 Newx(PL_efloatbuf, PL_efloatsize, char);
8722                 PL_efloatbuf[0] = '\0';
8723             }
8724
8725             if ( !(width || left || plus || alt) && fill != '0'
8726                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8727                 /* See earlier comment about buggy Gconvert when digits,
8728                    aka precis is 0  */
8729                 if ( c == 'g' && precis) {
8730                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8731                     /* May return an empty string for digits==0 */
8732                     if (*PL_efloatbuf) {
8733                         elen = strlen(PL_efloatbuf);
8734                         goto float_converted;
8735                     }
8736                 } else if ( c == 'f' && !precis) {
8737                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8738                         break;
8739                 }
8740             }
8741             {
8742                 char *ptr = ebuf + sizeof ebuf;
8743                 *--ptr = '\0';
8744                 *--ptr = c;
8745                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8746 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8747                 if (intsize == 'q') {
8748                     /* Copy the one or more characters in a long double
8749                      * format before the 'base' ([efgEFG]) character to
8750                      * the format string. */
8751                     static char const prifldbl[] = PERL_PRIfldbl;
8752                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8753                     while (p >= prifldbl) { *--ptr = *p--; }
8754                 }
8755 #endif
8756                 if (has_precis) {
8757                     base = precis;
8758                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8759                     *--ptr = '.';
8760                 }
8761                 if (width) {
8762                     base = width;
8763                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8764                 }
8765                 if (fill == '0')
8766                     *--ptr = fill;
8767                 if (left)
8768                     *--ptr = '-';
8769                 if (plus)
8770                     *--ptr = plus;
8771                 if (alt)
8772                     *--ptr = '#';
8773                 *--ptr = '%';
8774
8775                 /* No taint.  Otherwise we are in the strange situation
8776                  * where printf() taints but print($float) doesn't.
8777                  * --jhi */
8778 #if defined(HAS_LONG_DOUBLE)
8779                 elen = ((intsize == 'q')
8780                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8781                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8782 #else
8783                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8784 #endif
8785             }
8786         float_converted:
8787             eptr = PL_efloatbuf;
8788             break;
8789
8790             /* SPECIAL */
8791
8792         case 'n':
8793             i = SvCUR(sv) - origlen;
8794             if (args && !vectorize) {
8795                 switch (intsize) {
8796                 case 'h':       *(va_arg(*args, short*)) = i; break;
8797                 default:        *(va_arg(*args, int*)) = i; break;
8798                 case 'l':       *(va_arg(*args, long*)) = i; break;
8799                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8800 #ifdef HAS_QUAD
8801                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8802 #endif
8803                 }
8804             }
8805             else
8806                 sv_setuv_mg(argsv, (UV)i);
8807             vectorize = FALSE;
8808             continue;   /* not "break" */
8809
8810             /* UNKNOWN */
8811
8812         default:
8813       unknown:
8814             if (!args
8815                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8816                 && ckWARN(WARN_PRINTF))
8817             {
8818                 SV * const msg = sv_newmortal();
8819                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8820                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8821                 if (c) {
8822                     if (isPRINT(c))
8823                         Perl_sv_catpvf(aTHX_ msg,
8824                                        "\"%%%c\"", c & 0xFF);
8825                     else
8826                         Perl_sv_catpvf(aTHX_ msg,
8827                                        "\"%%\\%03"UVof"\"",
8828                                        (UV)c & 0xFF);
8829                 } else
8830                     sv_catpv(msg, "end of string");
8831                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8832             }
8833
8834             /* output mangled stuff ... */
8835             if (c == '\0')
8836                 --q;
8837             eptr = p;
8838             elen = q - p;
8839
8840             /* ... right here, because formatting flags should not apply */
8841             SvGROW(sv, SvCUR(sv) + elen + 1);
8842             p = SvEND(sv);
8843             Copy(eptr, p, elen, char);
8844             p += elen;
8845             *p = '\0';
8846             SvCUR_set(sv, p - SvPVX_const(sv));
8847             svix = osvix;
8848             continue;   /* not "break" */
8849         }
8850
8851         /* calculate width before utf8_upgrade changes it */
8852         have = esignlen + zeros + elen;
8853         if (have < zeros)
8854             Perl_croak_nocontext(PL_memory_wrap);
8855
8856         if (is_utf8 != has_utf8) {
8857              if (is_utf8) {
8858                   if (SvCUR(sv))
8859                        sv_utf8_upgrade(sv);
8860              }
8861              else {
8862                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8863                   sv_utf8_upgrade(nsv);
8864                   eptr = SvPVX_const(nsv);
8865                   elen = SvCUR(nsv);
8866              }
8867              SvGROW(sv, SvCUR(sv) + elen + 1);
8868              p = SvEND(sv);
8869              *p = '\0';
8870         }
8871
8872         need = (have > width ? have : width);
8873         gap = need - have;
8874
8875         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8876             Perl_croak_nocontext(PL_memory_wrap);
8877         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8878         p = SvEND(sv);
8879         if (esignlen && fill == '0') {
8880             int i;
8881             for (i = 0; i < (int)esignlen; i++)
8882                 *p++ = esignbuf[i];
8883         }
8884         if (gap && !left) {
8885             memset(p, fill, gap);
8886             p += gap;
8887         }
8888         if (esignlen && fill != '0') {
8889             int i;
8890             for (i = 0; i < (int)esignlen; i++)
8891                 *p++ = esignbuf[i];
8892         }
8893         if (zeros) {
8894             int i;
8895             for (i = zeros; i; i--)
8896                 *p++ = '0';
8897         }
8898         if (elen) {
8899             Copy(eptr, p, elen, char);
8900             p += elen;
8901         }
8902         if (gap && left) {
8903             memset(p, ' ', gap);
8904             p += gap;
8905         }
8906         if (vectorize) {
8907             if (veclen) {
8908                 Copy(dotstr, p, dotstrlen, char);
8909                 p += dotstrlen;
8910             }
8911             else
8912                 vectorize = FALSE;              /* done iterating over vecstr */
8913         }
8914         if (is_utf8)
8915             has_utf8 = TRUE;
8916         if (has_utf8)
8917             SvUTF8_on(sv);
8918         *p = '\0';
8919         SvCUR_set(sv, p - SvPVX_const(sv));
8920         if (vectorize) {
8921             esignlen = 0;
8922             goto vector;
8923         }
8924     }
8925 }
8926
8927 /* =========================================================================
8928
8929 =head1 Cloning an interpreter
8930
8931 All the macros and functions in this section are for the private use of
8932 the main function, perl_clone().
8933
8934 The foo_dup() functions make an exact copy of an existing foo thinngy.
8935 During the course of a cloning, a hash table is used to map old addresses
8936 to new addresses. The table is created and manipulated with the
8937 ptr_table_* functions.
8938
8939 =cut
8940
8941 ============================================================================*/
8942
8943
8944 #if defined(USE_ITHREADS)
8945
8946 #ifndef GpREFCNT_inc
8947 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8948 #endif
8949
8950
8951 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8952 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8953 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8954 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8955 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8956 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8957 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8958 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8959 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8960 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8961 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8962 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8963 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8964
8965
8966 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8967    regcomp.c. AMS 20010712 */
8968
8969 REGEXP *
8970 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8971 {
8972     dVAR;
8973     REGEXP *ret;
8974     int i, len, npar;
8975     struct reg_substr_datum *s;
8976
8977     if (!r)
8978         return (REGEXP *)NULL;
8979
8980     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8981         return ret;
8982
8983     len = r->offsets[0];
8984     npar = r->nparens+1;
8985
8986     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8987     Copy(r->program, ret->program, len+1, regnode);
8988
8989     Newx(ret->startp, npar, I32);
8990     Copy(r->startp, ret->startp, npar, I32);
8991     Newx(ret->endp, npar, I32);
8992     Copy(r->startp, ret->startp, npar, I32);
8993
8994     Newx(ret->substrs, 1, struct reg_substr_data);
8995     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
8996         s->min_offset = r->substrs->data[i].min_offset;
8997         s->max_offset = r->substrs->data[i].max_offset;
8998         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
8999         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
9000     }
9001
9002     ret->regstclass = NULL;
9003     if (r->data) {
9004         struct reg_data *d;
9005         const int count = r->data->count;
9006         int i;
9007
9008         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
9009                 char, struct reg_data);
9010         Newx(d->what, count, U8);
9011
9012         d->count = count;
9013         for (i = 0; i < count; i++) {
9014             d->what[i] = r->data->what[i];
9015             switch (d->what[i]) {
9016                 /* legal options are one of: sfpont
9017                    see also regcomp.h and pregfree() */
9018             case 's':
9019                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
9020                 break;
9021             case 'p':
9022                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
9023                 break;
9024             case 'f':
9025                 /* This is cheating. */
9026                 Newx(d->data[i], 1, struct regnode_charclass_class);
9027                 StructCopy(r->data->data[i], d->data[i],
9028                             struct regnode_charclass_class);
9029                 ret->regstclass = (regnode*)d->data[i];
9030                 break;
9031             case 'o':
9032                 /* Compiled op trees are readonly, and can thus be
9033                    shared without duplication. */
9034                 OP_REFCNT_LOCK;
9035                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
9036                 OP_REFCNT_UNLOCK;
9037                 break;
9038             case 'n':
9039                 d->data[i] = r->data->data[i];
9040                 break;
9041             case 't':
9042                 d->data[i] = r->data->data[i];
9043                 OP_REFCNT_LOCK;
9044                 ((reg_trie_data*)d->data[i])->refcount++;
9045                 OP_REFCNT_UNLOCK;
9046                 break;
9047             default:
9048                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
9049             }
9050         }
9051
9052         ret->data = d;
9053     }
9054     else
9055         ret->data = NULL;
9056
9057     Newx(ret->offsets, 2*len+1, U32);
9058     Copy(r->offsets, ret->offsets, 2*len+1, U32);
9059
9060     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
9061     ret->refcnt         = r->refcnt;
9062     ret->minlen         = r->minlen;
9063     ret->prelen         = r->prelen;
9064     ret->nparens        = r->nparens;
9065     ret->lastparen      = r->lastparen;
9066     ret->lastcloseparen = r->lastcloseparen;
9067     ret->reganch        = r->reganch;
9068
9069     ret->sublen         = r->sublen;
9070
9071     if (RX_MATCH_COPIED(ret))
9072         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
9073     else
9074         ret->subbeg = Nullch;
9075 #ifdef PERL_OLD_COPY_ON_WRITE
9076     ret->saved_copy = Nullsv;
9077 #endif
9078
9079     ptr_table_store(PL_ptr_table, r, ret);
9080     return ret;
9081 }
9082
9083 /* duplicate a file handle */
9084
9085 PerlIO *
9086 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
9087 {
9088     PerlIO *ret;
9089
9090     PERL_UNUSED_ARG(type);
9091
9092     if (!fp)
9093         return (PerlIO*)NULL;
9094
9095     /* look for it in the table first */
9096     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
9097     if (ret)
9098         return ret;
9099
9100     /* create anew and remember what it is */
9101     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
9102     ptr_table_store(PL_ptr_table, fp, ret);
9103     return ret;
9104 }
9105
9106 /* duplicate a directory handle */
9107
9108 DIR *
9109 Perl_dirp_dup(pTHX_ DIR *dp)
9110 {
9111     if (!dp)
9112         return (DIR*)NULL;
9113     /* XXX TODO */
9114     return dp;
9115 }
9116
9117 /* duplicate a typeglob */
9118
9119 GP *
9120 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
9121 {
9122     GP *ret;
9123     if (!gp)
9124         return (GP*)NULL;
9125     /* look for it in the table first */
9126     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
9127     if (ret)
9128         return ret;
9129
9130     /* create anew and remember what it is */
9131     Newxz(ret, 1, GP);
9132     ptr_table_store(PL_ptr_table, gp, ret);
9133
9134     /* clone */
9135     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
9136     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
9137     ret->gp_io          = io_dup_inc(gp->gp_io, param);
9138     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
9139     ret->gp_av          = av_dup_inc(gp->gp_av, param);
9140     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
9141     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
9142     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
9143     ret->gp_cvgen       = gp->gp_cvgen;
9144     ret->gp_line        = gp->gp_line;
9145     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
9146     return ret;
9147 }
9148
9149 /* duplicate a chain of magic */
9150
9151 MAGIC *
9152 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
9153 {
9154     MAGIC *mgprev = (MAGIC*)NULL;
9155     MAGIC *mgret;
9156     if (!mg)
9157         return (MAGIC*)NULL;
9158     /* look for it in the table first */
9159     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
9160     if (mgret)
9161         return mgret;
9162
9163     for (; mg; mg = mg->mg_moremagic) {
9164         MAGIC *nmg;
9165         Newxz(nmg, 1, MAGIC);
9166         if (mgprev)
9167             mgprev->mg_moremagic = nmg;
9168         else
9169             mgret = nmg;
9170         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
9171         nmg->mg_private = mg->mg_private;
9172         nmg->mg_type    = mg->mg_type;
9173         nmg->mg_flags   = mg->mg_flags;
9174         if (mg->mg_type == PERL_MAGIC_qr) {
9175             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
9176         }
9177         else if(mg->mg_type == PERL_MAGIC_backref) {
9178             const AV * const av = (AV*) mg->mg_obj;
9179             SV **svp;
9180             I32 i;
9181             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
9182             svp = AvARRAY(av);
9183             for (i = AvFILLp(av); i >= 0; i--) {
9184                 if (!svp[i]) continue;
9185                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
9186             }
9187         }
9188         else if (mg->mg_type == PERL_MAGIC_symtab) {
9189             nmg->mg_obj = mg->mg_obj;
9190         }
9191         else {
9192             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9193                               ? sv_dup_inc(mg->mg_obj, param)
9194                               : sv_dup(mg->mg_obj, param);
9195         }
9196         nmg->mg_len     = mg->mg_len;
9197         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9198         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9199             if (mg->mg_len > 0) {
9200                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9201                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9202                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9203                 {
9204                     AMT * const amtp = (AMT*)mg->mg_ptr;
9205                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9206                     I32 i;
9207                     for (i = 1; i < NofAMmeth; i++) {
9208                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9209                     }
9210                 }
9211             }
9212             else if (mg->mg_len == HEf_SVKEY)
9213                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9214         }
9215         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9216             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9217         }
9218         mgprev = nmg;
9219     }
9220     return mgret;
9221 }
9222
9223 /* create a new pointer-mapping table */
9224
9225 PTR_TBL_t *
9226 Perl_ptr_table_new(pTHX)
9227 {
9228     PTR_TBL_t *tbl;
9229     Newxz(tbl, 1, PTR_TBL_t);
9230     tbl->tbl_max        = 511;
9231     tbl->tbl_items      = 0;
9232     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9233     return tbl;
9234 }
9235
9236 #if (PTRSIZE == 8)
9237 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 3)
9238 #else
9239 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 2)
9240 #endif
9241
9242 /* 
9243    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9244    following define) and at call to new_body_inline made below in 
9245    Perl_ptr_table_store()
9246  */
9247
9248 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9249
9250 /* map an existing pointer using a table */
9251
9252 void *
9253 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9254 {
9255     PTR_TBL_ENT_t *tblent;
9256     const UV hash = PTR_TABLE_HASH(sv);
9257     assert(tbl);
9258     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9259     for (; tblent; tblent = tblent->next) {
9260         if (tblent->oldval == sv)
9261             return tblent->newval;
9262     }
9263     return (void*)NULL;
9264 }
9265
9266 /* add a new entry to a pointer-mapping table */
9267
9268 void
9269 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9270 {
9271     PTR_TBL_ENT_t *tblent, **otblent;
9272     /* XXX this may be pessimal on platforms where pointers aren't good
9273      * hash values e.g. if they grow faster in the most significant
9274      * bits */
9275     const UV hash = PTR_TABLE_HASH(oldsv);
9276     bool empty = 1;
9277
9278     assert(tbl);
9279     otblent = &tbl->tbl_ary[hash & tbl->tbl_max];
9280     for (tblent = *otblent; tblent; empty=0, tblent = tblent->next) {
9281         if (tblent->oldval == oldsv) {
9282             tblent->newval = newsv;
9283             return;
9284         }
9285     }
9286     new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9287     tblent->oldval = oldsv;
9288     tblent->newval = newsv;
9289     tblent->next = *otblent;
9290     *otblent = tblent;
9291     tbl->tbl_items++;
9292     if (!empty && tbl->tbl_items > tbl->tbl_max)
9293         ptr_table_split(tbl);
9294 }
9295
9296 /* double the hash bucket size of an existing ptr table */
9297
9298 void
9299 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9300 {
9301     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9302     const UV oldsize = tbl->tbl_max + 1;
9303     UV newsize = oldsize * 2;
9304     UV i;
9305
9306     Renew(ary, newsize, PTR_TBL_ENT_t*);
9307     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9308     tbl->tbl_max = --newsize;
9309     tbl->tbl_ary = ary;
9310     for (i=0; i < oldsize; i++, ary++) {
9311         PTR_TBL_ENT_t **curentp, **entp, *ent;
9312         if (!*ary)
9313             continue;
9314         curentp = ary + oldsize;
9315         for (entp = ary, ent = *ary; ent; ent = *entp) {
9316             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9317                 *entp = ent->next;
9318                 ent->next = *curentp;
9319                 *curentp = ent;
9320                 continue;
9321             }
9322             else
9323                 entp = &ent->next;
9324         }
9325     }
9326 }
9327
9328 /* remove all the entries from a ptr table */
9329
9330 void
9331 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9332 {
9333     register PTR_TBL_ENT_t **array;
9334     register PTR_TBL_ENT_t *entry;
9335     UV riter = 0;
9336     UV max;
9337
9338     if (!tbl || !tbl->tbl_items) {
9339         return;
9340     }
9341
9342     array = tbl->tbl_ary;
9343     entry = array[0];
9344     max = tbl->tbl_max;
9345
9346     for (;;) {
9347         if (entry) {
9348             PTR_TBL_ENT_t *oentry = entry;
9349             entry = entry->next;
9350             del_pte(oentry);
9351         }
9352         if (!entry) {
9353             if (++riter > max) {
9354                 break;
9355             }
9356             entry = array[riter];
9357         }
9358     }
9359
9360     tbl->tbl_items = 0;
9361 }
9362
9363 /* clear and free a ptr table */
9364
9365 void
9366 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9367 {
9368     if (!tbl) {
9369         return;
9370     }
9371     ptr_table_clear(tbl);
9372     Safefree(tbl->tbl_ary);
9373     Safefree(tbl);
9374 }
9375
9376
9377 void
9378 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9379 {
9380     if (SvROK(sstr)) {
9381         SvRV_set(dstr, SvWEAKREF(sstr)
9382                        ? sv_dup(SvRV(sstr), param)
9383                        : sv_dup_inc(SvRV(sstr), param));
9384
9385     }
9386     else if (SvPVX_const(sstr)) {
9387         /* Has something there */
9388         if (SvLEN(sstr)) {
9389             /* Normal PV - clone whole allocated space */
9390             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9391             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9392                 /* Not that normal - actually sstr is copy on write.
9393                    But we are a true, independant SV, so:  */
9394                 SvREADONLY_off(dstr);
9395                 SvFAKE_off(dstr);
9396             }
9397         }
9398         else {
9399             /* Special case - not normally malloced for some reason */
9400             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9401                 /* A "shared" PV - clone it as "shared" PV */
9402                 SvPV_set(dstr,
9403                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9404                                          param)));
9405             }
9406             else {
9407                 /* Some other special case - random pointer */
9408                 SvPV_set(dstr, SvPVX(sstr));            
9409             }
9410         }
9411     }
9412     else {
9413         /* Copy the Null */
9414         if (SvTYPE(dstr) == SVt_RV)
9415             SvRV_set(dstr, NULL);
9416         else
9417             SvPV_set(dstr, 0);
9418     }
9419 }
9420
9421 /* duplicate an SV of any type (including AV, HV etc) */
9422
9423 SV *
9424 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9425 {
9426     dVAR;
9427     SV *dstr;
9428
9429     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9430         return Nullsv;
9431     /* look for it in the table first */
9432     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9433     if (dstr)
9434         return dstr;
9435
9436     if(param->flags & CLONEf_JOIN_IN) {
9437         /** We are joining here so we don't want do clone
9438             something that is bad **/
9439         const char *hvname;
9440
9441         if(SvTYPE(sstr) == SVt_PVHV &&
9442            (hvname = HvNAME_get(sstr))) {
9443             /** don't clone stashes if they already exist **/
9444             return (SV*)gv_stashpv(hvname,0);
9445         }
9446     }
9447
9448     /* create anew and remember what it is */
9449     new_SV(dstr);
9450
9451 #ifdef DEBUG_LEAKING_SCALARS
9452     dstr->sv_debug_optype = sstr->sv_debug_optype;
9453     dstr->sv_debug_line = sstr->sv_debug_line;
9454     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9455     dstr->sv_debug_cloned = 1;
9456 #  ifdef NETWARE
9457     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9458 #  else
9459     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9460 #  endif
9461 #endif
9462
9463     ptr_table_store(PL_ptr_table, sstr, dstr);
9464
9465     /* clone */
9466     SvFLAGS(dstr)       = SvFLAGS(sstr);
9467     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9468     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9469
9470 #ifdef DEBUGGING
9471     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9472         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9473                       PL_watch_pvx, SvPVX_const(sstr));
9474 #endif
9475
9476     /* don't clone objects whose class has asked us not to */
9477     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9478         SvFLAGS(dstr) &= ~SVTYPEMASK;
9479         SvOBJECT_off(dstr);
9480         return dstr;
9481     }
9482
9483     switch (SvTYPE(sstr)) {
9484     case SVt_NULL:
9485         SvANY(dstr)     = NULL;
9486         break;
9487     case SVt_IV:
9488         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9489         SvIV_set(dstr, SvIVX(sstr));
9490         break;
9491     case SVt_NV:
9492         SvANY(dstr)     = new_XNV();
9493         SvNV_set(dstr, SvNVX(sstr));
9494         break;
9495     case SVt_RV:
9496         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9497         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9498         break;
9499     default:
9500         {
9501             /* These are all the types that need complex bodies allocating.  */
9502             void *new_body;
9503             const svtype sv_type = SvTYPE(sstr);
9504             const struct body_details *const sv_type_details
9505                 = bodies_by_type + sv_type;
9506
9507             switch (sv_type) {
9508             default:
9509                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9510                            (IV)SvTYPE(sstr));
9511                 break;
9512
9513             case SVt_PVGV:
9514                 if (GvUNIQUE((GV*)sstr)) {
9515                     /* Do sharing here, and fall through */
9516                 }
9517             case SVt_PVIO:
9518             case SVt_PVFM:
9519             case SVt_PVHV:
9520             case SVt_PVAV:
9521             case SVt_PVBM:
9522             case SVt_PVCV:
9523             case SVt_PVLV:
9524             case SVt_PVMG:
9525             case SVt_PVNV:
9526             case SVt_PVIV:
9527             case SVt_PV:
9528                 assert(sv_type_details->copy);
9529                 if (sv_type_details->arena) {
9530                     new_body_inline(new_body, sv_type_details->copy, sv_type);
9531                     new_body
9532                         = (void*)((char*)new_body - sv_type_details->offset);
9533                 } else {
9534                     new_body = new_NOARENA(sv_type_details);
9535                 }
9536             }
9537             assert(new_body);
9538             SvANY(dstr) = new_body;
9539
9540 #ifndef PURIFY
9541             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9542                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9543                  sv_type_details->copy, char);
9544 #else
9545             Copy(((char*)SvANY(sstr)),
9546                  ((char*)SvANY(dstr)),
9547                  sv_type_details->size + sv_type_details->offset, char);
9548 #endif
9549
9550             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9551                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9552
9553             /* The Copy above means that all the source (unduplicated) pointers
9554                are now in the destination.  We can check the flags and the
9555                pointers in either, but it's possible that there's less cache
9556                missing by always going for the destination.
9557                FIXME - instrument and check that assumption  */
9558             if (sv_type >= SVt_PVMG) {
9559                 if (SvMAGIC(dstr))
9560                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9561                 if (SvSTASH(dstr))
9562                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9563             }
9564
9565             /* The cast silences a GCC warning about unhandled types.  */
9566             switch ((int)sv_type) {
9567             case SVt_PV:
9568                 break;
9569             case SVt_PVIV:
9570                 break;
9571             case SVt_PVNV:
9572                 break;
9573             case SVt_PVMG:
9574                 break;
9575             case SVt_PVBM:
9576                 break;
9577             case SVt_PVLV:
9578                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9579                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9580                     LvTARG(dstr) = dstr;
9581                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9582                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9583                 else
9584                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9585                 break;
9586             case SVt_PVGV:
9587                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9588                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9589                 /* Don't call sv_add_backref here as it's going to be created
9590                    as part of the magic cloning of the symbol table.  */
9591                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9592                 (void)GpREFCNT_inc(GvGP(dstr));
9593                 break;
9594             case SVt_PVIO:
9595                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9596                 if (IoOFP(dstr) == IoIFP(sstr))
9597                     IoOFP(dstr) = IoIFP(dstr);
9598                 else
9599                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9600                 /* PL_rsfp_filters entries have fake IoDIRP() */
9601                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9602                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9603                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9604                     /* I have no idea why fake dirp (rsfps)
9605                        should be treated differently but otherwise
9606                        we end up with leaks -- sky*/
9607                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9608                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9609                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9610                 } else {
9611                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9612                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9613                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9614                 }
9615                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9616                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9617                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9618                 break;
9619             case SVt_PVAV:
9620                 if (AvARRAY((AV*)sstr)) {
9621                     SV **dst_ary, **src_ary;
9622                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9623
9624                     src_ary = AvARRAY((AV*)sstr);
9625                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9626                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9627                     SvPV_set(dstr, (char*)dst_ary);
9628                     AvALLOC((AV*)dstr) = dst_ary;
9629                     if (AvREAL((AV*)sstr)) {
9630                         while (items-- > 0)
9631                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9632                     }
9633                     else {
9634                         while (items-- > 0)
9635                             *dst_ary++ = sv_dup(*src_ary++, param);
9636                     }
9637                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9638                     while (items-- > 0) {
9639                         *dst_ary++ = &PL_sv_undef;
9640                     }
9641                 }
9642                 else {
9643                     SvPV_set(dstr, Nullch);
9644                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9645                 }
9646                 break;
9647             case SVt_PVHV:
9648                 {
9649                     HEK *hvname = 0;
9650
9651                     if (HvARRAY((HV*)sstr)) {
9652                         STRLEN i = 0;
9653                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9654                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9655                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9656                         char *darray;
9657                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9658                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9659                             char);
9660                         HvARRAY(dstr) = (HE**)darray;
9661                         while (i <= sxhv->xhv_max) {
9662                             const HE *source = HvARRAY(sstr)[i];
9663                             HvARRAY(dstr)[i] = source
9664                                 ? he_dup(source, sharekeys, param) : 0;
9665                             ++i;
9666                         }
9667                         if (SvOOK(sstr)) {
9668                             struct xpvhv_aux *saux = HvAUX(sstr);
9669                             struct xpvhv_aux *daux = HvAUX(dstr);
9670                             /* This flag isn't copied.  */
9671                             /* SvOOK_on(hv) attacks the IV flags.  */
9672                             SvFLAGS(dstr) |= SVf_OOK;
9673
9674                             hvname = saux->xhv_name;
9675                             daux->xhv_name
9676                                 = hvname ? hek_dup(hvname, param) : hvname;
9677
9678                             daux->xhv_riter = saux->xhv_riter;
9679                             daux->xhv_eiter = saux->xhv_eiter
9680                                 ? he_dup(saux->xhv_eiter,
9681                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9682                         }
9683                     }
9684                     else {
9685                         SvPV_set(dstr, Nullch);
9686                     }
9687                     /* Record stashes for possible cloning in Perl_clone(). */
9688                     if(hvname)
9689                         av_push(param->stashes, dstr);
9690                 }
9691                 break;
9692             case SVt_PVFM:
9693             case SVt_PVCV:
9694                 /* NOTE: not refcounted */
9695                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9696                 OP_REFCNT_LOCK;
9697                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9698                 OP_REFCNT_UNLOCK;
9699                 if (CvCONST(dstr)) {
9700                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9701                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9702                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9703                 }
9704                 /* don't dup if copying back - CvGV isn't refcounted, so the
9705                  * duped GV may never be freed. A bit of a hack! DAPM */
9706                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9707                     Nullgv : gv_dup(CvGV(dstr), param) ;
9708                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9709                     CvDEPTH(dstr) = 0;
9710                 }
9711                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9712                 CvOUTSIDE(dstr) =
9713                     CvWEAKOUTSIDE(sstr)
9714                     ? cv_dup(    CvOUTSIDE(dstr), param)
9715                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9716                 if (!CvXSUB(dstr))
9717                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9718                 break;
9719             }
9720         }
9721     }
9722
9723     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9724         ++PL_sv_objcount;
9725
9726     return dstr;
9727  }
9728
9729 /* duplicate a context */
9730
9731 PERL_CONTEXT *
9732 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9733 {
9734     PERL_CONTEXT *ncxs;
9735
9736     if (!cxs)
9737         return (PERL_CONTEXT*)NULL;
9738
9739     /* look for it in the table first */
9740     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9741     if (ncxs)
9742         return ncxs;
9743
9744     /* create anew and remember what it is */
9745     Newxz(ncxs, max + 1, PERL_CONTEXT);
9746     ptr_table_store(PL_ptr_table, cxs, ncxs);
9747
9748     while (ix >= 0) {
9749         PERL_CONTEXT *cx = &cxs[ix];
9750         PERL_CONTEXT *ncx = &ncxs[ix];
9751         ncx->cx_type    = cx->cx_type;
9752         if (CxTYPE(cx) == CXt_SUBST) {
9753             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9754         }
9755         else {
9756             ncx->blk_oldsp      = cx->blk_oldsp;
9757             ncx->blk_oldcop     = cx->blk_oldcop;
9758             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9759             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9760             ncx->blk_oldpm      = cx->blk_oldpm;
9761             ncx->blk_gimme      = cx->blk_gimme;
9762             switch (CxTYPE(cx)) {
9763             case CXt_SUB:
9764                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9765                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9766                                            : cv_dup(cx->blk_sub.cv,param));
9767                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9768                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9769                                            : Nullav);
9770                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9771                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9772                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9773                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9774                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9775                 break;
9776             case CXt_EVAL:
9777                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9778                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9779                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9780                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9781                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9782                 ncx->blk_eval.retop = cx->blk_eval.retop;
9783                 break;
9784             case CXt_LOOP:
9785                 ncx->blk_loop.label     = cx->blk_loop.label;
9786                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9787                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9788                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9789                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9790                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9791                                            ? cx->blk_loop.iterdata
9792                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9793                 ncx->blk_loop.oldcomppad
9794                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9795                                             cx->blk_loop.oldcomppad);
9796                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9797                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9798                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9799                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9800                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9801                 break;
9802             case CXt_FORMAT:
9803                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9804                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9805                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9806                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9807                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9808                 break;
9809             case CXt_BLOCK:
9810             case CXt_NULL:
9811                 break;
9812             }
9813         }
9814         --ix;
9815     }
9816     return ncxs;
9817 }
9818
9819 /* duplicate a stack info structure */
9820
9821 PERL_SI *
9822 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9823 {
9824     PERL_SI *nsi;
9825
9826     if (!si)
9827         return (PERL_SI*)NULL;
9828
9829     /* look for it in the table first */
9830     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9831     if (nsi)
9832         return nsi;
9833
9834     /* create anew and remember what it is */
9835     Newxz(nsi, 1, PERL_SI);
9836     ptr_table_store(PL_ptr_table, si, nsi);
9837
9838     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9839     nsi->si_cxix        = si->si_cxix;
9840     nsi->si_cxmax       = si->si_cxmax;
9841     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9842     nsi->si_type        = si->si_type;
9843     nsi->si_prev        = si_dup(si->si_prev, param);
9844     nsi->si_next        = si_dup(si->si_next, param);
9845     nsi->si_markoff     = si->si_markoff;
9846
9847     return nsi;
9848 }
9849
9850 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9851 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9852 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9853 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9854 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9855 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9856 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9857 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9858 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9859 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9860 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9861 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9862 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9863 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9864
9865 /* XXXXX todo */
9866 #define pv_dup_inc(p)   SAVEPV(p)
9867 #define pv_dup(p)       SAVEPV(p)
9868 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9869
9870 /* map any object to the new equivent - either something in the
9871  * ptr table, or something in the interpreter structure
9872  */
9873
9874 void *
9875 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9876 {
9877     void *ret;
9878
9879     if (!v)
9880         return (void*)NULL;
9881
9882     /* look for it in the table first */
9883     ret = ptr_table_fetch(PL_ptr_table, v);
9884     if (ret)
9885         return ret;
9886
9887     /* see if it is part of the interpreter structure */
9888     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9889         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9890     else {
9891         ret = v;
9892     }
9893
9894     return ret;
9895 }
9896
9897 /* duplicate the save stack */
9898
9899 ANY *
9900 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9901 {
9902     ANY * const ss      = proto_perl->Tsavestack;
9903     const I32 max       = proto_perl->Tsavestack_max;
9904     I32 ix              = proto_perl->Tsavestack_ix;
9905     ANY *nss;
9906     SV *sv;
9907     GV *gv;
9908     AV *av;
9909     HV *hv;
9910     void* ptr;
9911     int intval;
9912     long longval;
9913     GP *gp;
9914     IV iv;
9915     char *c = NULL;
9916     void (*dptr) (void*);
9917     void (*dxptr) (pTHX_ void*);
9918
9919     Newxz(nss, max, ANY);
9920
9921     while (ix > 0) {
9922         I32 i = POPINT(ss,ix);
9923         TOPINT(nss,ix) = i;
9924         switch (i) {
9925         case SAVEt_ITEM:                        /* normal string */
9926             sv = (SV*)POPPTR(ss,ix);
9927             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9928             sv = (SV*)POPPTR(ss,ix);
9929             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9930             break;
9931         case SAVEt_SV:                          /* scalar reference */
9932             sv = (SV*)POPPTR(ss,ix);
9933             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9934             gv = (GV*)POPPTR(ss,ix);
9935             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9936             break;
9937         case SAVEt_GENERIC_PVREF:               /* generic char* */
9938             c = (char*)POPPTR(ss,ix);
9939             TOPPTR(nss,ix) = pv_dup(c);
9940             ptr = POPPTR(ss,ix);
9941             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9942             break;
9943         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9944             c = (char*)POPPTR(ss,ix);
9945             TOPPTR(nss,ix) = savesharedpv(c);
9946             ptr = POPPTR(ss,ix);
9947             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9948             break;
9949         case SAVEt_GENERIC_SVREF:               /* generic sv */
9950         case SAVEt_SVREF:                       /* scalar reference */
9951             sv = (SV*)POPPTR(ss,ix);
9952             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9953             ptr = POPPTR(ss,ix);
9954             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9955             break;
9956         case SAVEt_AV:                          /* array reference */
9957             av = (AV*)POPPTR(ss,ix);
9958             TOPPTR(nss,ix) = av_dup_inc(av, param);
9959             gv = (GV*)POPPTR(ss,ix);
9960             TOPPTR(nss,ix) = gv_dup(gv, param);
9961             break;
9962         case SAVEt_HV:                          /* hash reference */
9963             hv = (HV*)POPPTR(ss,ix);
9964             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9965             gv = (GV*)POPPTR(ss,ix);
9966             TOPPTR(nss,ix) = gv_dup(gv, param);
9967             break;
9968         case SAVEt_INT:                         /* int reference */
9969             ptr = POPPTR(ss,ix);
9970             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9971             intval = (int)POPINT(ss,ix);
9972             TOPINT(nss,ix) = intval;
9973             break;
9974         case SAVEt_LONG:                        /* long reference */
9975             ptr = POPPTR(ss,ix);
9976             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9977             longval = (long)POPLONG(ss,ix);
9978             TOPLONG(nss,ix) = longval;
9979             break;
9980         case SAVEt_I32:                         /* I32 reference */
9981         case SAVEt_I16:                         /* I16 reference */
9982         case SAVEt_I8:                          /* I8 reference */
9983             ptr = POPPTR(ss,ix);
9984             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9985             i = POPINT(ss,ix);
9986             TOPINT(nss,ix) = i;
9987             break;
9988         case SAVEt_IV:                          /* IV reference */
9989             ptr = POPPTR(ss,ix);
9990             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9991             iv = POPIV(ss,ix);
9992             TOPIV(nss,ix) = iv;
9993             break;
9994         case SAVEt_SPTR:                        /* SV* reference */
9995             ptr = POPPTR(ss,ix);
9996             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9997             sv = (SV*)POPPTR(ss,ix);
9998             TOPPTR(nss,ix) = sv_dup(sv, param);
9999             break;
10000         case SAVEt_VPTR:                        /* random* reference */
10001             ptr = POPPTR(ss,ix);
10002             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10003             ptr = POPPTR(ss,ix);
10004             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10005             break;
10006         case SAVEt_PPTR:                        /* char* reference */
10007             ptr = POPPTR(ss,ix);
10008             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10009             c = (char*)POPPTR(ss,ix);
10010             TOPPTR(nss,ix) = pv_dup(c);
10011             break;
10012         case SAVEt_HPTR:                        /* HV* reference */
10013             ptr = POPPTR(ss,ix);
10014             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10015             hv = (HV*)POPPTR(ss,ix);
10016             TOPPTR(nss,ix) = hv_dup(hv, param);
10017             break;
10018         case SAVEt_APTR:                        /* AV* reference */
10019             ptr = POPPTR(ss,ix);
10020             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10021             av = (AV*)POPPTR(ss,ix);
10022             TOPPTR(nss,ix) = av_dup(av, param);
10023             break;
10024         case SAVEt_NSTAB:
10025             gv = (GV*)POPPTR(ss,ix);
10026             TOPPTR(nss,ix) = gv_dup(gv, param);
10027             break;
10028         case SAVEt_GP:                          /* scalar reference */
10029             gp = (GP*)POPPTR(ss,ix);
10030             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
10031             (void)GpREFCNT_inc(gp);
10032             gv = (GV*)POPPTR(ss,ix);
10033             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
10034             c = (char*)POPPTR(ss,ix);
10035             TOPPTR(nss,ix) = pv_dup(c);
10036             iv = POPIV(ss,ix);
10037             TOPIV(nss,ix) = iv;
10038             iv = POPIV(ss,ix);
10039             TOPIV(nss,ix) = iv;
10040             break;
10041         case SAVEt_FREESV:
10042         case SAVEt_MORTALIZESV:
10043             sv = (SV*)POPPTR(ss,ix);
10044             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10045             break;
10046         case SAVEt_FREEOP:
10047             ptr = POPPTR(ss,ix);
10048             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
10049                 /* these are assumed to be refcounted properly */
10050                 OP *o;
10051                 switch (((OP*)ptr)->op_type) {
10052                 case OP_LEAVESUB:
10053                 case OP_LEAVESUBLV:
10054                 case OP_LEAVEEVAL:
10055                 case OP_LEAVE:
10056                 case OP_SCOPE:
10057                 case OP_LEAVEWRITE:
10058                     TOPPTR(nss,ix) = ptr;
10059                     o = (OP*)ptr;
10060                     OpREFCNT_inc(o);
10061                     break;
10062                 default:
10063                     TOPPTR(nss,ix) = Nullop;
10064                     break;
10065                 }
10066             }
10067             else
10068                 TOPPTR(nss,ix) = Nullop;
10069             break;
10070         case SAVEt_FREEPV:
10071             c = (char*)POPPTR(ss,ix);
10072             TOPPTR(nss,ix) = pv_dup_inc(c);
10073             break;
10074         case SAVEt_CLEARSV:
10075             longval = POPLONG(ss,ix);
10076             TOPLONG(nss,ix) = longval;
10077             break;
10078         case SAVEt_DELETE:
10079             hv = (HV*)POPPTR(ss,ix);
10080             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10081             c = (char*)POPPTR(ss,ix);
10082             TOPPTR(nss,ix) = pv_dup_inc(c);
10083             i = POPINT(ss,ix);
10084             TOPINT(nss,ix) = i;
10085             break;
10086         case SAVEt_DESTRUCTOR:
10087             ptr = POPPTR(ss,ix);
10088             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10089             dptr = POPDPTR(ss,ix);
10090             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
10091                                         any_dup(FPTR2DPTR(void *, dptr),
10092                                                 proto_perl));
10093             break;
10094         case SAVEt_DESTRUCTOR_X:
10095             ptr = POPPTR(ss,ix);
10096             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
10097             dxptr = POPDXPTR(ss,ix);
10098             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
10099                                          any_dup(FPTR2DPTR(void *, dxptr),
10100                                                  proto_perl));
10101             break;
10102         case SAVEt_REGCONTEXT:
10103         case SAVEt_ALLOC:
10104             i = POPINT(ss,ix);
10105             TOPINT(nss,ix) = i;
10106             ix -= i;
10107             break;
10108         case SAVEt_STACK_POS:           /* Position on Perl stack */
10109             i = POPINT(ss,ix);
10110             TOPINT(nss,ix) = i;
10111             break;
10112         case SAVEt_AELEM:               /* array element */
10113             sv = (SV*)POPPTR(ss,ix);
10114             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10115             i = POPINT(ss,ix);
10116             TOPINT(nss,ix) = i;
10117             av = (AV*)POPPTR(ss,ix);
10118             TOPPTR(nss,ix) = av_dup_inc(av, param);
10119             break;
10120         case SAVEt_HELEM:               /* hash element */
10121             sv = (SV*)POPPTR(ss,ix);
10122             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10123             sv = (SV*)POPPTR(ss,ix);
10124             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10125             hv = (HV*)POPPTR(ss,ix);
10126             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10127             break;
10128         case SAVEt_OP:
10129             ptr = POPPTR(ss,ix);
10130             TOPPTR(nss,ix) = ptr;
10131             break;
10132         case SAVEt_HINTS:
10133             i = POPINT(ss,ix);
10134             TOPINT(nss,ix) = i;
10135             break;
10136         case SAVEt_COMPPAD:
10137             av = (AV*)POPPTR(ss,ix);
10138             TOPPTR(nss,ix) = av_dup(av, param);
10139             break;
10140         case SAVEt_PADSV:
10141             longval = (long)POPLONG(ss,ix);
10142             TOPLONG(nss,ix) = longval;
10143             ptr = POPPTR(ss,ix);
10144             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10145             sv = (SV*)POPPTR(ss,ix);
10146             TOPPTR(nss,ix) = sv_dup(sv, param);
10147             break;
10148         case SAVEt_BOOL:
10149             ptr = POPPTR(ss,ix);
10150             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10151             longval = (long)POPBOOL(ss,ix);
10152             TOPBOOL(nss,ix) = (bool)longval;
10153             break;
10154         case SAVEt_SET_SVFLAGS:
10155             i = POPINT(ss,ix);
10156             TOPINT(nss,ix) = i;
10157             i = POPINT(ss,ix);
10158             TOPINT(nss,ix) = i;
10159             sv = (SV*)POPPTR(ss,ix);
10160             TOPPTR(nss,ix) = sv_dup(sv, param);
10161             break;
10162         default:
10163             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
10164         }
10165     }
10166
10167     return nss;
10168 }
10169
10170
10171 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
10172  * flag to the result. This is done for each stash before cloning starts,
10173  * so we know which stashes want their objects cloned */
10174
10175 static void
10176 do_mark_cloneable_stash(pTHX_ SV *sv)
10177 {
10178     const HEK * const hvname = HvNAME_HEK((HV*)sv);
10179     if (hvname) {
10180         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
10181         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
10182         if (cloner && GvCV(cloner)) {
10183             dSP;
10184             UV status;
10185
10186             ENTER;
10187             SAVETMPS;
10188             PUSHMARK(SP);
10189             XPUSHs(sv_2mortal(newSVhek(hvname)));
10190             PUTBACK;
10191             call_sv((SV*)GvCV(cloner), G_SCALAR);
10192             SPAGAIN;
10193             status = POPu;
10194             PUTBACK;
10195             FREETMPS;
10196             LEAVE;
10197             if (status)
10198                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
10199         }
10200     }
10201 }
10202
10203
10204
10205 /*
10206 =for apidoc perl_clone
10207
10208 Create and return a new interpreter by cloning the current one.
10209
10210 perl_clone takes these flags as parameters:
10211
10212 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10213 without it we only clone the data and zero the stacks,
10214 with it we copy the stacks and the new perl interpreter is
10215 ready to run at the exact same point as the previous one.
10216 The pseudo-fork code uses COPY_STACKS while the
10217 threads->new doesn't.
10218
10219 CLONEf_KEEP_PTR_TABLE
10220 perl_clone keeps a ptr_table with the pointer of the old
10221 variable as a key and the new variable as a value,
10222 this allows it to check if something has been cloned and not
10223 clone it again but rather just use the value and increase the
10224 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10225 the ptr_table using the function
10226 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10227 reason to keep it around is if you want to dup some of your own
10228 variable who are outside the graph perl scans, example of this
10229 code is in threads.xs create
10230
10231 CLONEf_CLONE_HOST
10232 This is a win32 thing, it is ignored on unix, it tells perls
10233 win32host code (which is c++) to clone itself, this is needed on
10234 win32 if you want to run two threads at the same time,
10235 if you just want to do some stuff in a separate perl interpreter
10236 and then throw it away and return to the original one,
10237 you don't need to do anything.
10238
10239 =cut
10240 */
10241
10242 /* XXX the above needs expanding by someone who actually understands it ! */
10243 EXTERN_C PerlInterpreter *
10244 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10245
10246 PerlInterpreter *
10247 perl_clone(PerlInterpreter *proto_perl, UV flags)
10248 {
10249    dVAR;
10250 #ifdef PERL_IMPLICIT_SYS
10251
10252    /* perlhost.h so we need to call into it
10253    to clone the host, CPerlHost should have a c interface, sky */
10254
10255    if (flags & CLONEf_CLONE_HOST) {
10256        return perl_clone_host(proto_perl,flags);
10257    }
10258    return perl_clone_using(proto_perl, flags,
10259                             proto_perl->IMem,
10260                             proto_perl->IMemShared,
10261                             proto_perl->IMemParse,
10262                             proto_perl->IEnv,
10263                             proto_perl->IStdIO,
10264                             proto_perl->ILIO,
10265                             proto_perl->IDir,
10266                             proto_perl->ISock,
10267                             proto_perl->IProc);
10268 }
10269
10270 PerlInterpreter *
10271 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10272                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10273                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10274                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10275                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10276                  struct IPerlProc* ipP)
10277 {
10278     /* XXX many of the string copies here can be optimized if they're
10279      * constants; they need to be allocated as common memory and just
10280      * their pointers copied. */
10281
10282     IV i;
10283     CLONE_PARAMS clone_params;
10284     CLONE_PARAMS* param = &clone_params;
10285
10286     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10287     /* for each stash, determine whether its objects should be cloned */
10288     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10289     PERL_SET_THX(my_perl);
10290
10291 #  ifdef DEBUGGING
10292     Poison(my_perl, 1, PerlInterpreter);
10293     PL_op = Nullop;
10294     PL_curcop = (COP *)Nullop;
10295     PL_markstack = 0;
10296     PL_scopestack = 0;
10297     PL_savestack = 0;
10298     PL_savestack_ix = 0;
10299     PL_savestack_max = -1;
10300     PL_sig_pending = 0;
10301     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10302 #  else /* !DEBUGGING */
10303     Zero(my_perl, 1, PerlInterpreter);
10304 #  endif        /* DEBUGGING */
10305
10306     /* host pointers */
10307     PL_Mem              = ipM;
10308     PL_MemShared        = ipMS;
10309     PL_MemParse         = ipMP;
10310     PL_Env              = ipE;
10311     PL_StdIO            = ipStd;
10312     PL_LIO              = ipLIO;
10313     PL_Dir              = ipD;
10314     PL_Sock             = ipS;
10315     PL_Proc             = ipP;
10316 #else           /* !PERL_IMPLICIT_SYS */
10317     IV i;
10318     CLONE_PARAMS clone_params;
10319     CLONE_PARAMS* param = &clone_params;
10320     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10321     /* for each stash, determine whether its objects should be cloned */
10322     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10323     PERL_SET_THX(my_perl);
10324
10325 #    ifdef DEBUGGING
10326     Poison(my_perl, 1, PerlInterpreter);
10327     PL_op = Nullop;
10328     PL_curcop = (COP *)Nullop;
10329     PL_markstack = 0;
10330     PL_scopestack = 0;
10331     PL_savestack = 0;
10332     PL_savestack_ix = 0;
10333     PL_savestack_max = -1;
10334     PL_sig_pending = 0;
10335     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10336 #    else       /* !DEBUGGING */
10337     Zero(my_perl, 1, PerlInterpreter);
10338 #    endif      /* DEBUGGING */
10339 #endif          /* PERL_IMPLICIT_SYS */
10340     param->flags = flags;
10341     param->proto_perl = proto_perl;
10342
10343     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10344     Zero(&PL_body_roots, 1, PL_body_roots);
10345     
10346     PL_nice_chunk       = NULL;
10347     PL_nice_chunk_size  = 0;
10348     PL_sv_count         = 0;
10349     PL_sv_objcount      = 0;
10350     PL_sv_root          = Nullsv;
10351     PL_sv_arenaroot     = Nullsv;
10352
10353     PL_debug            = proto_perl->Idebug;
10354
10355     PL_hash_seed        = proto_perl->Ihash_seed;
10356     PL_rehash_seed      = proto_perl->Irehash_seed;
10357
10358 #ifdef USE_REENTRANT_API
10359     /* XXX: things like -Dm will segfault here in perlio, but doing
10360      *  PERL_SET_CONTEXT(proto_perl);
10361      * breaks too many other things
10362      */
10363     Perl_reentrant_init(aTHX);
10364 #endif
10365
10366     /* create SV map for pointer relocation */
10367     PL_ptr_table = ptr_table_new();
10368
10369     /* initialize these special pointers as early as possible */
10370     SvANY(&PL_sv_undef)         = NULL;
10371     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10372     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10373     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10374
10375     SvANY(&PL_sv_no)            = new_XPVNV();
10376     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10377     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10378                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10379     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10380     SvCUR_set(&PL_sv_no, 0);
10381     SvLEN_set(&PL_sv_no, 1);
10382     SvIV_set(&PL_sv_no, 0);
10383     SvNV_set(&PL_sv_no, 0);
10384     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10385
10386     SvANY(&PL_sv_yes)           = new_XPVNV();
10387     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10388     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10389                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10390     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10391     SvCUR_set(&PL_sv_yes, 1);
10392     SvLEN_set(&PL_sv_yes, 2);
10393     SvIV_set(&PL_sv_yes, 1);
10394     SvNV_set(&PL_sv_yes, 1);
10395     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10396
10397     /* create (a non-shared!) shared string table */
10398     PL_strtab           = newHV();
10399     HvSHAREKEYS_off(PL_strtab);
10400     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10401     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10402
10403     PL_compiling = proto_perl->Icompiling;
10404
10405     /* These two PVs will be free'd special way so must set them same way op.c does */
10406     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10407     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10408
10409     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10410     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10411
10412     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10413     if (!specialWARN(PL_compiling.cop_warnings))
10414         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10415     if (!specialCopIO(PL_compiling.cop_io))
10416         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10417     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10418
10419     /* pseudo environmental stuff */
10420     PL_origargc         = proto_perl->Iorigargc;
10421     PL_origargv         = proto_perl->Iorigargv;
10422
10423     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10424
10425     /* Set tainting stuff before PerlIO_debug can possibly get called */
10426     PL_tainting         = proto_perl->Itainting;
10427     PL_taint_warn       = proto_perl->Itaint_warn;
10428
10429 #ifdef PERLIO_LAYERS
10430     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10431     PerlIO_clone(aTHX_ proto_perl, param);
10432 #endif
10433
10434     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10435     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10436     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10437     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10438     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10439     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10440
10441     /* switches */
10442     PL_minus_c          = proto_perl->Iminus_c;
10443     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10444     PL_localpatches     = proto_perl->Ilocalpatches;
10445     PL_splitstr         = proto_perl->Isplitstr;
10446     PL_preprocess       = proto_perl->Ipreprocess;
10447     PL_minus_n          = proto_perl->Iminus_n;
10448     PL_minus_p          = proto_perl->Iminus_p;
10449     PL_minus_l          = proto_perl->Iminus_l;
10450     PL_minus_a          = proto_perl->Iminus_a;
10451     PL_minus_F          = proto_perl->Iminus_F;
10452     PL_doswitches       = proto_perl->Idoswitches;
10453     PL_dowarn           = proto_perl->Idowarn;
10454     PL_doextract        = proto_perl->Idoextract;
10455     PL_sawampersand     = proto_perl->Isawampersand;
10456     PL_unsafe           = proto_perl->Iunsafe;
10457     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10458     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10459     PL_perldb           = proto_perl->Iperldb;
10460     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10461     PL_exit_flags       = proto_perl->Iexit_flags;
10462
10463     /* magical thingies */
10464     /* XXX time(&PL_basetime) when asked for? */
10465     PL_basetime         = proto_perl->Ibasetime;
10466     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10467
10468     PL_maxsysfd         = proto_perl->Imaxsysfd;
10469     PL_multiline        = proto_perl->Imultiline;
10470     PL_statusvalue      = proto_perl->Istatusvalue;
10471 #ifdef VMS
10472     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10473 #else
10474     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10475 #endif
10476     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10477
10478     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10479     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10480     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10481
10482     /* Clone the regex array */
10483     PL_regex_padav = newAV();
10484     {
10485         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10486         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10487         IV i;
10488         av_push(PL_regex_padav,
10489                 sv_dup_inc(regexen[0],param));
10490         for(i = 1; i <= len; i++) {
10491             if(SvREPADTMP(regexen[i])) {
10492               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10493             } else {
10494                 av_push(PL_regex_padav,
10495                     SvREFCNT_inc(
10496                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10497                              SvIVX(regexen[i])), param)))
10498                        ));
10499             }
10500         }
10501     }
10502     PL_regex_pad = AvARRAY(PL_regex_padav);
10503
10504     /* shortcuts to various I/O objects */
10505     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10506     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10507     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10508     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10509     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10510     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10511
10512     /* shortcuts to regexp stuff */
10513     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10514
10515     /* shortcuts to misc objects */
10516     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10517
10518     /* shortcuts to debugging objects */
10519     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10520     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10521     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10522     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10523     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10524     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10525     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10526     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10527     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10528
10529     /* symbol tables */
10530     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10531     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10532     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10533     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10534     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10535
10536     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10537     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10538     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10539     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10540     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10541     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10542
10543     PL_sub_generation   = proto_perl->Isub_generation;
10544
10545     /* funky return mechanisms */
10546     PL_forkprocess      = proto_perl->Iforkprocess;
10547
10548     /* subprocess state */
10549     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10550
10551     /* internal state */
10552     PL_maxo             = proto_perl->Imaxo;
10553     if (proto_perl->Iop_mask)
10554         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10555     else
10556         PL_op_mask      = Nullch;
10557     /* PL_asserting        = proto_perl->Iasserting; */
10558
10559     /* current interpreter roots */
10560     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10561     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10562     PL_main_start       = proto_perl->Imain_start;
10563     PL_eval_root        = proto_perl->Ieval_root;
10564     PL_eval_start       = proto_perl->Ieval_start;
10565
10566     /* runtime control stuff */
10567     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10568     PL_copline          = proto_perl->Icopline;
10569
10570     PL_filemode         = proto_perl->Ifilemode;
10571     PL_lastfd           = proto_perl->Ilastfd;
10572     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10573     PL_Argv             = NULL;
10574     PL_Cmd              = Nullch;
10575     PL_gensym           = proto_perl->Igensym;
10576     PL_preambled        = proto_perl->Ipreambled;
10577     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10578     PL_laststatval      = proto_perl->Ilaststatval;
10579     PL_laststype        = proto_perl->Ilaststype;
10580     PL_mess_sv          = Nullsv;
10581
10582     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10583
10584     /* interpreter atexit processing */
10585     PL_exitlistlen      = proto_perl->Iexitlistlen;
10586     if (PL_exitlistlen) {
10587         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10588         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10589     }
10590     else
10591         PL_exitlist     = (PerlExitListEntry*)NULL;
10592     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10593     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10594     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10595
10596     PL_profiledata      = NULL;
10597     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10598     /* PL_rsfp_filters entries have fake IoDIRP() */
10599     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10600
10601     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10602
10603     PAD_CLONE_VARS(proto_perl, param);
10604
10605 #ifdef HAVE_INTERP_INTERN
10606     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10607 #endif
10608
10609     /* more statics moved here */
10610     PL_generation       = proto_perl->Igeneration;
10611     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10612
10613     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10614     PL_in_clean_all     = proto_perl->Iin_clean_all;
10615
10616     PL_uid              = proto_perl->Iuid;
10617     PL_euid             = proto_perl->Ieuid;
10618     PL_gid              = proto_perl->Igid;
10619     PL_egid             = proto_perl->Iegid;
10620     PL_nomemok          = proto_perl->Inomemok;
10621     PL_an               = proto_perl->Ian;
10622     PL_evalseq          = proto_perl->Ievalseq;
10623     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10624     PL_origalen         = proto_perl->Iorigalen;
10625 #ifdef PERL_USES_PL_PIDSTATUS
10626     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10627 #endif
10628     PL_osname           = SAVEPV(proto_perl->Iosname);
10629     PL_sighandlerp      = proto_perl->Isighandlerp;
10630
10631     PL_runops           = proto_perl->Irunops;
10632
10633     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10634
10635 #ifdef CSH
10636     PL_cshlen           = proto_perl->Icshlen;
10637     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10638 #endif
10639
10640     PL_lex_state        = proto_perl->Ilex_state;
10641     PL_lex_defer        = proto_perl->Ilex_defer;
10642     PL_lex_expect       = proto_perl->Ilex_expect;
10643     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10644     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10645     PL_lex_starts       = proto_perl->Ilex_starts;
10646     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10647     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10648     PL_lex_op           = proto_perl->Ilex_op;
10649     PL_lex_inpat        = proto_perl->Ilex_inpat;
10650     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10651     PL_lex_brackets     = proto_perl->Ilex_brackets;
10652     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10653     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10654     PL_lex_casemods     = proto_perl->Ilex_casemods;
10655     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10656     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10657
10658     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10659     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10660     PL_nexttoke         = proto_perl->Inexttoke;
10661
10662     /* XXX This is probably masking the deeper issue of why
10663      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10664      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10665      * (A little debugging with a watchpoint on it may help.)
10666      */
10667     if (SvANY(proto_perl->Ilinestr)) {
10668         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10669         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10670         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10671         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10672         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10673         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10674         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10675         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10676         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10677     }
10678     else {
10679         PL_linestr = NEWSV(65,79);
10680         sv_upgrade(PL_linestr,SVt_PVIV);
10681         sv_setpvn(PL_linestr,"",0);
10682         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10683     }
10684     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10685     PL_pending_ident    = proto_perl->Ipending_ident;
10686     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10687
10688     PL_expect           = proto_perl->Iexpect;
10689
10690     PL_multi_start      = proto_perl->Imulti_start;
10691     PL_multi_end        = proto_perl->Imulti_end;
10692     PL_multi_open       = proto_perl->Imulti_open;
10693     PL_multi_close      = proto_perl->Imulti_close;
10694
10695     PL_error_count      = proto_perl->Ierror_count;
10696     PL_subline          = proto_perl->Isubline;
10697     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10698
10699     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10700     if (SvANY(proto_perl->Ilinestr)) {
10701         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10702         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10703         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10704         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10705         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10706     }
10707     else {
10708         PL_last_uni     = SvPVX(PL_linestr);
10709         PL_last_lop     = SvPVX(PL_linestr);
10710         PL_last_lop_op  = 0;
10711     }
10712     PL_in_my            = proto_perl->Iin_my;
10713     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10714 #ifdef FCRYPT
10715     PL_cryptseen        = proto_perl->Icryptseen;
10716 #endif
10717
10718     PL_hints            = proto_perl->Ihints;
10719
10720     PL_amagic_generation        = proto_perl->Iamagic_generation;
10721
10722 #ifdef USE_LOCALE_COLLATE
10723     PL_collation_ix     = proto_perl->Icollation_ix;
10724     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10725     PL_collation_standard       = proto_perl->Icollation_standard;
10726     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10727     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10728 #endif /* USE_LOCALE_COLLATE */
10729
10730 #ifdef USE_LOCALE_NUMERIC
10731     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10732     PL_numeric_standard = proto_perl->Inumeric_standard;
10733     PL_numeric_local    = proto_perl->Inumeric_local;
10734     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10735 #endif /* !USE_LOCALE_NUMERIC */
10736
10737     /* utf8 character classes */
10738     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10739     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10740     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10741     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10742     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10743     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10744     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10745     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10746     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10747     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10748     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10749     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10750     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10751     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10752     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10753     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10754     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10755     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10756     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10757     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10758
10759     /* Did the locale setup indicate UTF-8? */
10760     PL_utf8locale       = proto_perl->Iutf8locale;
10761     /* Unicode features (see perlrun/-C) */
10762     PL_unicode          = proto_perl->Iunicode;
10763
10764     /* Pre-5.8 signals control */
10765     PL_signals          = proto_perl->Isignals;
10766
10767     /* times() ticks per second */
10768     PL_clocktick        = proto_perl->Iclocktick;
10769
10770     /* Recursion stopper for PerlIO_find_layer */
10771     PL_in_load_module   = proto_perl->Iin_load_module;
10772
10773     /* sort() routine */
10774     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10775
10776     /* Not really needed/useful since the reenrant_retint is "volatile",
10777      * but do it for consistency's sake. */
10778     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10779
10780     /* Hooks to shared SVs and locks. */
10781     PL_sharehook        = proto_perl->Isharehook;
10782     PL_lockhook         = proto_perl->Ilockhook;
10783     PL_unlockhook       = proto_perl->Iunlockhook;
10784     PL_threadhook       = proto_perl->Ithreadhook;
10785
10786     PL_runops_std       = proto_perl->Irunops_std;
10787     PL_runops_dbg       = proto_perl->Irunops_dbg;
10788
10789 #ifdef THREADS_HAVE_PIDS
10790     PL_ppid             = proto_perl->Ippid;
10791 #endif
10792
10793     /* swatch cache */
10794     PL_last_swash_hv    = Nullhv;       /* reinits on demand */
10795     PL_last_swash_klen  = 0;
10796     PL_last_swash_key[0]= '\0';
10797     PL_last_swash_tmps  = (U8*)NULL;
10798     PL_last_swash_slen  = 0;
10799
10800     PL_glob_index       = proto_perl->Iglob_index;
10801     PL_srand_called     = proto_perl->Isrand_called;
10802     PL_uudmap['M']      = 0;            /* reinits on demand */
10803     PL_bitcount         = Nullch;       /* reinits on demand */
10804
10805     if (proto_perl->Ipsig_pend) {
10806         Newxz(PL_psig_pend, SIG_SIZE, int);
10807     }
10808     else {
10809         PL_psig_pend    = (int*)NULL;
10810     }
10811
10812     if (proto_perl->Ipsig_ptr) {
10813         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10814         Newxz(PL_psig_name, SIG_SIZE, SV*);
10815         for (i = 1; i < SIG_SIZE; i++) {
10816             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10817             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10818         }
10819     }
10820     else {
10821         PL_psig_ptr     = (SV**)NULL;
10822         PL_psig_name    = (SV**)NULL;
10823     }
10824
10825     /* thrdvar.h stuff */
10826
10827     if (flags & CLONEf_COPY_STACKS) {
10828         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10829         PL_tmps_ix              = proto_perl->Ttmps_ix;
10830         PL_tmps_max             = proto_perl->Ttmps_max;
10831         PL_tmps_floor           = proto_perl->Ttmps_floor;
10832         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10833         i = 0;
10834         while (i <= PL_tmps_ix) {
10835             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10836             ++i;
10837         }
10838
10839         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10840         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10841         Newxz(PL_markstack, i, I32);
10842         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10843                                                   - proto_perl->Tmarkstack);
10844         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10845                                                   - proto_perl->Tmarkstack);
10846         Copy(proto_perl->Tmarkstack, PL_markstack,
10847              PL_markstack_ptr - PL_markstack + 1, I32);
10848
10849         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10850          * NOTE: unlike the others! */
10851         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10852         PL_scopestack_max       = proto_perl->Tscopestack_max;
10853         Newxz(PL_scopestack, PL_scopestack_max, I32);
10854         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10855
10856         /* NOTE: si_dup() looks at PL_markstack */
10857         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10858
10859         /* PL_curstack          = PL_curstackinfo->si_stack; */
10860         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10861         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10862
10863         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10864         PL_stack_base           = AvARRAY(PL_curstack);
10865         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10866                                                    - proto_perl->Tstack_base);
10867         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10868
10869         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10870          * NOTE: unlike the others! */
10871         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10872         PL_savestack_max        = proto_perl->Tsavestack_max;
10873         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10874         PL_savestack            = ss_dup(proto_perl, param);
10875     }
10876     else {
10877         init_stacks();
10878         ENTER;                  /* perl_destruct() wants to LEAVE; */
10879     }
10880
10881     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10882     PL_top_env          = &PL_start_env;
10883
10884     PL_op               = proto_perl->Top;
10885
10886     PL_Sv               = Nullsv;
10887     PL_Xpv              = (XPV*)NULL;
10888     PL_na               = proto_perl->Tna;
10889
10890     PL_statbuf          = proto_perl->Tstatbuf;
10891     PL_statcache        = proto_perl->Tstatcache;
10892     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10893     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10894 #ifdef HAS_TIMES
10895     PL_timesbuf         = proto_perl->Ttimesbuf;
10896 #endif
10897
10898     PL_tainted          = proto_perl->Ttainted;
10899     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10900     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10901     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10902     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10903     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10904     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10905     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10906     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10907     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10908
10909     PL_restartop        = proto_perl->Trestartop;
10910     PL_in_eval          = proto_perl->Tin_eval;
10911     PL_delaymagic       = proto_perl->Tdelaymagic;
10912     PL_dirty            = proto_perl->Tdirty;
10913     PL_localizing       = proto_perl->Tlocalizing;
10914
10915     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10916     PL_hv_fetch_ent_mh  = Nullhe;
10917     PL_modcount         = proto_perl->Tmodcount;
10918     PL_lastgotoprobe    = Nullop;
10919     PL_dumpindent       = proto_perl->Tdumpindent;
10920
10921     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10922     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10923     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10924     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10925     PL_efloatbuf        = Nullch;               /* reinits on demand */
10926     PL_efloatsize       = 0;                    /* reinits on demand */
10927
10928     /* regex stuff */
10929
10930     PL_screamfirst      = NULL;
10931     PL_screamnext       = NULL;
10932     PL_maxscream        = -1;                   /* reinits on demand */
10933     PL_lastscream       = Nullsv;
10934
10935     PL_watchaddr        = NULL;
10936     PL_watchok          = Nullch;
10937
10938     PL_regdummy         = proto_perl->Tregdummy;
10939     PL_regprecomp       = Nullch;
10940     PL_regnpar          = 0;
10941     PL_regsize          = 0;
10942     PL_colorset         = 0;            /* reinits PL_colors[] */
10943     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10944     PL_reginput         = Nullch;
10945     PL_regbol           = Nullch;
10946     PL_regeol           = Nullch;
10947     PL_regstartp        = (I32*)NULL;
10948     PL_regendp          = (I32*)NULL;
10949     PL_reglastparen     = (U32*)NULL;
10950     PL_reglastcloseparen        = (U32*)NULL;
10951     PL_regtill          = Nullch;
10952     PL_reg_start_tmp    = (char**)NULL;
10953     PL_reg_start_tmpl   = 0;
10954     PL_regdata          = (struct reg_data*)NULL;
10955     PL_bostr            = Nullch;
10956     PL_reg_flags        = 0;
10957     PL_reg_eval_set     = 0;
10958     PL_regnarrate       = 0;
10959     PL_regprogram       = (regnode*)NULL;
10960     PL_regindent        = 0;
10961     PL_regcc            = (CURCUR*)NULL;
10962     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10963     PL_reg_re           = (regexp*)NULL;
10964     PL_reg_ganch        = Nullch;
10965     PL_reg_sv           = Nullsv;
10966     PL_reg_match_utf8   = FALSE;
10967     PL_reg_magic        = (MAGIC*)NULL;
10968     PL_reg_oldpos       = 0;
10969     PL_reg_oldcurpm     = (PMOP*)NULL;
10970     PL_reg_curpm        = (PMOP*)NULL;
10971     PL_reg_oldsaved     = Nullch;
10972     PL_reg_oldsavedlen  = 0;
10973 #ifdef PERL_OLD_COPY_ON_WRITE
10974     PL_nrs              = Nullsv;
10975 #endif
10976     PL_reg_maxiter      = 0;
10977     PL_reg_leftiter     = 0;
10978     PL_reg_poscache     = Nullch;
10979     PL_reg_poscache_size= 0;
10980
10981     /* RE engine - function pointers */
10982     PL_regcompp         = proto_perl->Tregcompp;
10983     PL_regexecp         = proto_perl->Tregexecp;
10984     PL_regint_start     = proto_perl->Tregint_start;
10985     PL_regint_string    = proto_perl->Tregint_string;
10986     PL_regfree          = proto_perl->Tregfree;
10987
10988     PL_reginterp_cnt    = 0;
10989     PL_reg_starttry     = 0;
10990
10991     /* Pluggable optimizer */
10992     PL_peepp            = proto_perl->Tpeepp;
10993
10994     PL_stashcache       = newHV();
10995
10996     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
10997         ptr_table_free(PL_ptr_table);
10998         PL_ptr_table = NULL;
10999     }
11000
11001     /* Call the ->CLONE method, if it exists, for each of the stashes
11002        identified by sv_dup() above.
11003     */
11004     while(av_len(param->stashes) != -1) {
11005         HV* const stash = (HV*) av_shift(param->stashes);
11006         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
11007         if (cloner && GvCV(cloner)) {
11008             dSP;
11009             ENTER;
11010             SAVETMPS;
11011             PUSHMARK(SP);
11012             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
11013             PUTBACK;
11014             call_sv((SV*)GvCV(cloner), G_DISCARD);
11015             FREETMPS;
11016             LEAVE;
11017         }
11018     }
11019
11020     SvREFCNT_dec(param->stashes);
11021
11022     /* orphaned? eg threads->new inside BEGIN or use */
11023     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
11024         (void)SvREFCNT_inc(PL_compcv);
11025         SAVEFREESV(PL_compcv);
11026     }
11027
11028     return my_perl;
11029 }
11030
11031 #endif /* USE_ITHREADS */
11032
11033 /*
11034 =head1 Unicode Support
11035
11036 =for apidoc sv_recode_to_utf8
11037
11038 The encoding is assumed to be an Encode object, on entry the PV
11039 of the sv is assumed to be octets in that encoding, and the sv
11040 will be converted into Unicode (and UTF-8).
11041
11042 If the sv already is UTF-8 (or if it is not POK), or if the encoding
11043 is not a reference, nothing is done to the sv.  If the encoding is not
11044 an C<Encode::XS> Encoding object, bad things will happen.
11045 (See F<lib/encoding.pm> and L<Encode>).
11046
11047 The PV of the sv is returned.
11048
11049 =cut */
11050
11051 char *
11052 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
11053 {
11054     dVAR;
11055     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
11056         SV *uni;
11057         STRLEN len;
11058         const char *s;
11059         dSP;
11060         ENTER;
11061         SAVETMPS;
11062         save_re_context();
11063         PUSHMARK(sp);
11064         EXTEND(SP, 3);
11065         XPUSHs(encoding);
11066         XPUSHs(sv);
11067 /*
11068   NI-S 2002/07/09
11069   Passing sv_yes is wrong - it needs to be or'ed set of constants
11070   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
11071   remove converted chars from source.
11072
11073   Both will default the value - let them.
11074
11075         XPUSHs(&PL_sv_yes);
11076 */
11077         PUTBACK;
11078         call_method("decode", G_SCALAR);
11079         SPAGAIN;
11080         uni = POPs;
11081         PUTBACK;
11082         s = SvPV_const(uni, len);
11083         if (s != SvPVX_const(sv)) {
11084             SvGROW(sv, len + 1);
11085             Move(s, SvPVX(sv), len + 1, char);
11086             SvCUR_set(sv, len);
11087         }
11088         FREETMPS;
11089         LEAVE;
11090         SvUTF8_on(sv);
11091         return SvPVX(sv);
11092     }
11093     return SvPOKp(sv) ? SvPVX(sv) : NULL;
11094 }
11095
11096 /*
11097 =for apidoc sv_cat_decode
11098
11099 The encoding is assumed to be an Encode object, the PV of the ssv is
11100 assumed to be octets in that encoding and decoding the input starts
11101 from the position which (PV + *offset) pointed to.  The dsv will be
11102 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
11103 when the string tstr appears in decoding output or the input ends on
11104 the PV of the ssv. The value which the offset points will be modified
11105 to the last input position on the ssv.
11106
11107 Returns TRUE if the terminator was found, else returns FALSE.
11108
11109 =cut */
11110
11111 bool
11112 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
11113                    SV *ssv, int *offset, char *tstr, int tlen)
11114 {
11115     dVAR;
11116     bool ret = FALSE;
11117     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
11118         SV *offsv;
11119         dSP;
11120         ENTER;
11121         SAVETMPS;
11122         save_re_context();
11123         PUSHMARK(sp);
11124         EXTEND(SP, 6);
11125         XPUSHs(encoding);
11126         XPUSHs(dsv);
11127         XPUSHs(ssv);
11128         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
11129         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
11130         PUTBACK;
11131         call_method("cat_decode", G_SCALAR);
11132         SPAGAIN;
11133         ret = SvTRUE(TOPs);
11134         *offset = SvIV(offsv);
11135         PUTBACK;
11136         FREETMPS;
11137         LEAVE;
11138     }
11139     else
11140         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
11141     return ret;
11142
11143 }
11144
11145 /* ---------------------------------------------------------------------
11146  *
11147  * support functions for report_uninit()
11148  */
11149
11150 /* the maxiumum size of array or hash where we will scan looking
11151  * for the undefined element that triggered the warning */
11152
11153 #define FUV_MAX_SEARCH_SIZE 1000
11154
11155 /* Look for an entry in the hash whose value has the same SV as val;
11156  * If so, return a mortal copy of the key. */
11157
11158 STATIC SV*
11159 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
11160 {
11161     dVAR;
11162     register HE **array;
11163     I32 i;
11164
11165     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
11166                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
11167         return Nullsv;
11168
11169     array = HvARRAY(hv);
11170
11171     for (i=HvMAX(hv); i>0; i--) {
11172         register HE *entry;
11173         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
11174             if (HeVAL(entry) != val)
11175                 continue;
11176             if (    HeVAL(entry) == &PL_sv_undef ||
11177                     HeVAL(entry) == &PL_sv_placeholder)
11178                 continue;
11179             if (!HeKEY(entry))
11180                 return Nullsv;
11181             if (HeKLEN(entry) == HEf_SVKEY)
11182                 return sv_mortalcopy(HeKEY_sv(entry));
11183             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
11184         }
11185     }
11186     return Nullsv;
11187 }
11188
11189 /* Look for an entry in the array whose value has the same SV as val;
11190  * If so, return the index, otherwise return -1. */
11191
11192 STATIC I32
11193 S_find_array_subscript(pTHX_ AV *av, SV* val)
11194 {
11195     SV** svp;
11196     I32 i;
11197     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
11198                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
11199         return -1;
11200
11201     svp = AvARRAY(av);
11202     for (i=AvFILLp(av); i>=0; i--) {
11203         if (svp[i] == val && svp[i] != &PL_sv_undef)
11204             return i;
11205     }
11206     return -1;
11207 }
11208
11209 /* S_varname(): return the name of a variable, optionally with a subscript.
11210  * If gv is non-zero, use the name of that global, along with gvtype (one
11211  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11212  * targ.  Depending on the value of the subscript_type flag, return:
11213  */
11214
11215 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11216 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11217 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11218 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11219
11220 STATIC SV*
11221 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11222         SV* keyname, I32 aindex, int subscript_type)
11223 {
11224
11225     SV * const name = sv_newmortal();
11226     if (gv) {
11227         char buffer[2];
11228         buffer[0] = gvtype;
11229         buffer[1] = 0;
11230
11231         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11232
11233         gv_fullname4(name, gv, buffer, 0);
11234
11235         if ((unsigned int)SvPVX(name)[1] <= 26) {
11236             buffer[0] = '^';
11237             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11238
11239             /* Swap the 1 unprintable control character for the 2 byte pretty
11240                version - ie substr($name, 1, 1) = $buffer; */
11241             sv_insert(name, 1, 1, buffer, 2);
11242         }
11243     }
11244     else {
11245         U32 unused;
11246         CV * const cv = find_runcv(&unused);
11247         SV *sv;
11248         AV *av;
11249
11250         if (!cv || !CvPADLIST(cv))
11251             return Nullsv;
11252         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11253         sv = *av_fetch(av, targ, FALSE);
11254         /* SvLEN in a pad name is not to be trusted */
11255         sv_setpv(name, SvPV_nolen_const(sv));
11256     }
11257
11258     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11259         SV * const sv = NEWSV(0,0);
11260         *SvPVX(name) = '$';
11261         Perl_sv_catpvf(aTHX_ name, "{%s}",
11262             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11263         SvREFCNT_dec(sv);
11264     }
11265     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11266         *SvPVX(name) = '$';
11267         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11268     }
11269     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11270         sv_insert(name, 0, 0,  "within ", 7);
11271
11272     return name;
11273 }
11274
11275
11276 /*
11277 =for apidoc find_uninit_var
11278
11279 Find the name of the undefined variable (if any) that caused the operator o
11280 to issue a "Use of uninitialized value" warning.
11281 If match is true, only return a name if it's value matches uninit_sv.
11282 So roughly speaking, if a unary operator (such as OP_COS) generates a
11283 warning, then following the direct child of the op may yield an
11284 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11285 other hand, with OP_ADD there are two branches to follow, so we only print
11286 the variable name if we get an exact match.
11287
11288 The name is returned as a mortal SV.
11289
11290 Assumes that PL_op is the op that originally triggered the error, and that
11291 PL_comppad/PL_curpad points to the currently executing pad.
11292
11293 =cut
11294 */
11295
11296 STATIC SV *
11297 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11298 {
11299     dVAR;
11300     SV *sv;
11301     AV *av;
11302     GV *gv;
11303     OP *o, *o2, *kid;
11304
11305     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11306                             uninit_sv == &PL_sv_placeholder)))
11307         return Nullsv;
11308
11309     switch (obase->op_type) {
11310
11311     case OP_RV2AV:
11312     case OP_RV2HV:
11313     case OP_PADAV:
11314     case OP_PADHV:
11315       {
11316         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11317         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11318         I32 index = 0;
11319         SV *keysv = Nullsv;
11320         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11321
11322         if (pad) { /* @lex, %lex */
11323             sv = PAD_SVl(obase->op_targ);
11324             gv = Nullgv;
11325         }
11326         else {
11327             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11328             /* @global, %global */
11329                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11330                 if (!gv)
11331                     break;
11332                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11333             }
11334             else /* @{expr}, %{expr} */
11335                 return find_uninit_var(cUNOPx(obase)->op_first,
11336                                                     uninit_sv, match);
11337         }
11338
11339         /* attempt to find a match within the aggregate */
11340         if (hash) {
11341             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11342             if (keysv)
11343                 subscript_type = FUV_SUBSCRIPT_HASH;
11344         }
11345         else {
11346             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11347             if (index >= 0)
11348                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11349         }
11350
11351         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11352             break;
11353
11354         return varname(gv, hash ? '%' : '@', obase->op_targ,
11355                                     keysv, index, subscript_type);
11356       }
11357
11358     case OP_PADSV:
11359         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11360             break;
11361         return varname(Nullgv, '$', obase->op_targ,
11362                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11363
11364     case OP_GVSV:
11365         gv = cGVOPx_gv(obase);
11366         if (!gv || (match && GvSV(gv) != uninit_sv))
11367             break;
11368         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11369
11370     case OP_AELEMFAST:
11371         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11372             if (match) {
11373                 SV **svp;
11374                 av = (AV*)PAD_SV(obase->op_targ);
11375                 if (!av || SvRMAGICAL(av))
11376                     break;
11377                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11378                 if (!svp || *svp != uninit_sv)
11379                     break;
11380             }
11381             return varname(Nullgv, '$', obase->op_targ,
11382                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11383         }
11384         else {
11385             gv = cGVOPx_gv(obase);
11386             if (!gv)
11387                 break;
11388             if (match) {
11389                 SV **svp;
11390                 av = GvAV(gv);
11391                 if (!av || SvRMAGICAL(av))
11392                     break;
11393                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11394                 if (!svp || *svp != uninit_sv)
11395                     break;
11396             }
11397             return varname(gv, '$', 0,
11398                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11399         }
11400         break;
11401
11402     case OP_EXISTS:
11403         o = cUNOPx(obase)->op_first;
11404         if (!o || o->op_type != OP_NULL ||
11405                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11406             break;
11407         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11408
11409     case OP_AELEM:
11410     case OP_HELEM:
11411         if (PL_op == obase)
11412             /* $a[uninit_expr] or $h{uninit_expr} */
11413             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11414
11415         gv = Nullgv;
11416         o = cBINOPx(obase)->op_first;
11417         kid = cBINOPx(obase)->op_last;
11418
11419         /* get the av or hv, and optionally the gv */
11420         sv = Nullsv;
11421         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11422             sv = PAD_SV(o->op_targ);
11423         }
11424         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11425                 && cUNOPo->op_first->op_type == OP_GV)
11426         {
11427             gv = cGVOPx_gv(cUNOPo->op_first);
11428             if (!gv)
11429                 break;
11430             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11431         }
11432         if (!sv)
11433             break;
11434
11435         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11436             /* index is constant */
11437             if (match) {
11438                 if (SvMAGICAL(sv))
11439                     break;
11440                 if (obase->op_type == OP_HELEM) {
11441                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11442                     if (!he || HeVAL(he) != uninit_sv)
11443                         break;
11444                 }
11445                 else {
11446                     SV ** const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11447                     if (!svp || *svp != uninit_sv)
11448                         break;
11449                 }
11450             }
11451             if (obase->op_type == OP_HELEM)
11452                 return varname(gv, '%', o->op_targ,
11453                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11454             else
11455                 return varname(gv, '@', o->op_targ, Nullsv,
11456                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11457             ;
11458         }
11459         else  {
11460             /* index is an expression;
11461              * attempt to find a match within the aggregate */
11462             if (obase->op_type == OP_HELEM) {
11463                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11464                 if (keysv)
11465                     return varname(gv, '%', o->op_targ,
11466                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11467             }
11468             else {
11469                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11470                 if (index >= 0)
11471                     return varname(gv, '@', o->op_targ,
11472                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11473             }
11474             if (match)
11475                 break;
11476             return varname(gv,
11477                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11478                 ? '@' : '%',
11479                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11480         }
11481
11482         break;
11483
11484     case OP_AASSIGN:
11485         /* only examine RHS */
11486         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11487
11488     case OP_OPEN:
11489         o = cUNOPx(obase)->op_first;
11490         if (o->op_type == OP_PUSHMARK)
11491             o = o->op_sibling;
11492
11493         if (!o->op_sibling) {
11494             /* one-arg version of open is highly magical */
11495
11496             if (o->op_type == OP_GV) { /* open FOO; */
11497                 gv = cGVOPx_gv(o);
11498                 if (match && GvSV(gv) != uninit_sv)
11499                     break;
11500                 return varname(gv, '$', 0,
11501                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11502             }
11503             /* other possibilities not handled are:
11504              * open $x; or open my $x;  should return '${*$x}'
11505              * open expr;               should return '$'.expr ideally
11506              */
11507              break;
11508         }
11509         goto do_op;
11510
11511     /* ops where $_ may be an implicit arg */
11512     case OP_TRANS:
11513     case OP_SUBST:
11514     case OP_MATCH:
11515         if ( !(obase->op_flags & OPf_STACKED)) {
11516             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11517                                  ? PAD_SVl(obase->op_targ)
11518                                  : DEFSV))
11519             {
11520                 sv = sv_newmortal();
11521                 sv_setpvn(sv, "$_", 2);
11522                 return sv;
11523             }
11524         }
11525         goto do_op;
11526
11527     case OP_PRTF:
11528     case OP_PRINT:
11529         /* skip filehandle as it can't produce 'undef' warning  */
11530         o = cUNOPx(obase)->op_first;
11531         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11532             o = o->op_sibling->op_sibling;
11533         goto do_op2;
11534
11535
11536     case OP_RV2SV:
11537     case OP_CUSTOM:
11538     case OP_ENTERSUB:
11539         match = 1; /* XS or custom code could trigger random warnings */
11540         goto do_op;
11541
11542     case OP_SCHOMP:
11543     case OP_CHOMP:
11544         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11545             return sv_2mortal(newSVpvn("${$/}", 5));
11546         /* FALL THROUGH */
11547
11548     default:
11549     do_op:
11550         if (!(obase->op_flags & OPf_KIDS))
11551             break;
11552         o = cUNOPx(obase)->op_first;
11553         
11554     do_op2:
11555         if (!o)
11556             break;
11557
11558         /* if all except one arg are constant, or have no side-effects,
11559          * or are optimized away, then it's unambiguous */
11560         o2 = Nullop;
11561         for (kid=o; kid; kid = kid->op_sibling) {
11562             if (kid &&
11563                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11564                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11565                   || (kid->op_type == OP_PUSHMARK)
11566                 )
11567             )
11568                 continue;
11569             if (o2) { /* more than one found */
11570                 o2 = Nullop;
11571                 break;
11572             }
11573             o2 = kid;
11574         }
11575         if (o2)
11576             return find_uninit_var(o2, uninit_sv, match);
11577
11578         /* scan all args */
11579         while (o) {
11580             sv = find_uninit_var(o, uninit_sv, 1);
11581             if (sv)
11582                 return sv;
11583             o = o->op_sibling;
11584         }
11585         break;
11586     }
11587     return Nullsv;
11588 }
11589
11590
11591 /*
11592 =for apidoc report_uninit
11593
11594 Print appropriate "Use of uninitialized variable" warning
11595
11596 =cut
11597 */
11598
11599 void
11600 Perl_report_uninit(pTHX_ SV* uninit_sv)
11601 {
11602     if (PL_op) {
11603         SV* varname = Nullsv;
11604         if (uninit_sv) {
11605             varname = find_uninit_var(PL_op, uninit_sv,0);
11606             if (varname)
11607                 sv_insert(varname, 0, 0, " ", 1);
11608         }
11609         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11610                 varname ? SvPV_nolen_const(varname) : "",
11611                 " in ", OP_DESC(PL_op));
11612     }
11613     else
11614         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11615                     "", "", "");
11616 }
11617
11618 /*
11619  * Local variables:
11620  * c-indentation-style: bsd
11621  * c-basic-offset: 4
11622  * indent-tabs-mode: t
11623  * End:
11624  *
11625  * ex: set ts=8 sts=4 sw=4 noet:
11626  */