Improve description of the -s switch.
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, 2006, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* const sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = NULL;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void ** const arena_root    = &PL_body_arenaroots[sv_type];
644     void ** const root          = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void ** const r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void ** const thing_copy = (void **)thing;\
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      - relative_STRUCT_OFFSET(xpv_allocated, XPV, xpv_cur),
813      + relative_STRUCT_OFFSET(xpv_allocated, XPV, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      - relative_STRUCT_OFFSET(xpviv_allocated, XPVIV, xpv_cur),
819      + relative_STRUCT_OFFSET(xpviv_allocated, XPVIV, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      - relative_STRUCT_OFFSET(xpvav_allocated, XPVAV, xav_fill),
835      + relative_STRUCT_OFFSET(xpvav_allocated, XPVAV, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      - relative_STRUCT_OFFSET(xpvhv_allocated, XPVHV, xhv_fill),
841      + relative_STRUCT_OFFSET(xpvhv_allocated, XPVHV, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126         /* If NV 0.0 is stores as all bits 0 then Zero() already creates a
1127          * correct 0.0 for us.  Otherwise, if the old body didn't have an
1128          * NV slot, but the new one does, then we need to initialise the
1129          * freshly created NV slot with whatever the correct bit pattern is
1130          * for 0.0  */
1131         if (old_type_details->zero_nv && !new_type_details->zero_nv)
1132             SvNV_set(sv, 0);
1133 #endif
1134
1135         if (new_type == SVt_PVIO)
1136             IoPAGE_LEN(sv) = 60;
1137         if (old_type < SVt_RV)
1138             SvPV_set(sv, 0);
1139         break;
1140     default:
1141         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1142     }
1143
1144     if (old_type_details->size) {
1145         /* If the old body had an allocated size, then we need to free it.  */
1146 #ifdef PURIFY
1147         my_safefree(old_body);
1148 #else
1149         del_body((void*)((char*)old_body + old_type_details->offset),
1150                  &PL_body_roots[old_type]);
1151 #endif
1152     }
1153 }
1154
1155 /*
1156 =for apidoc sv_backoff
1157
1158 Remove any string offset. You should normally use the C<SvOOK_off> macro
1159 wrapper instead.
1160
1161 =cut
1162 */
1163
1164 int
1165 Perl_sv_backoff(pTHX_ register SV *sv)
1166 {
1167     assert(SvOOK(sv));
1168     assert(SvTYPE(sv) != SVt_PVHV);
1169     assert(SvTYPE(sv) != SVt_PVAV);
1170     if (SvIVX(sv)) {
1171         const char * const s = SvPVX_const(sv);
1172         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1173         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1174         SvIV_set(sv, 0);
1175         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1176     }
1177     SvFLAGS(sv) &= ~SVf_OOK;
1178     return 0;
1179 }
1180
1181 /*
1182 =for apidoc sv_grow
1183
1184 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1185 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1186 Use the C<SvGROW> wrapper instead.
1187
1188 =cut
1189 */
1190
1191 char *
1192 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1193 {
1194     register char *s;
1195
1196 #ifdef HAS_64K_LIMIT
1197     if (newlen >= 0x10000) {
1198         PerlIO_printf(Perl_debug_log,
1199                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1200         my_exit(1);
1201     }
1202 #endif /* HAS_64K_LIMIT */
1203     if (SvROK(sv))
1204         sv_unref(sv);
1205     if (SvTYPE(sv) < SVt_PV) {
1206         sv_upgrade(sv, SVt_PV);
1207         s = SvPVX_mutable(sv);
1208     }
1209     else if (SvOOK(sv)) {       /* pv is offset? */
1210         sv_backoff(sv);
1211         s = SvPVX_mutable(sv);
1212         if (newlen > SvLEN(sv))
1213             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1214 #ifdef HAS_64K_LIMIT
1215         if (newlen >= 0x10000)
1216             newlen = 0xFFFF;
1217 #endif
1218     }
1219     else
1220         s = SvPVX_mutable(sv);
1221
1222     if (newlen > SvLEN(sv)) {           /* need more room? */
1223         newlen = PERL_STRLEN_ROUNDUP(newlen);
1224         if (SvLEN(sv) && s) {
1225 #ifdef MYMALLOC
1226             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1227             if (newlen <= l) {
1228                 SvLEN_set(sv, l);
1229                 return s;
1230             } else
1231 #endif
1232             s = saferealloc(s, newlen);
1233         }
1234         else {
1235             s = safemalloc(newlen);
1236             if (SvPVX_const(sv) && SvCUR(sv)) {
1237                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1238             }
1239         }
1240         SvPV_set(sv, s);
1241         SvLEN_set(sv, newlen);
1242     }
1243     return s;
1244 }
1245
1246 /*
1247 =for apidoc sv_setiv
1248
1249 Copies an integer into the given SV, upgrading first if necessary.
1250 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1251
1252 =cut
1253 */
1254
1255 void
1256 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1257 {
1258     SV_CHECK_THINKFIRST_COW_DROP(sv);
1259     switch (SvTYPE(sv)) {
1260     case SVt_NULL:
1261         sv_upgrade(sv, SVt_IV);
1262         break;
1263     case SVt_NV:
1264         sv_upgrade(sv, SVt_PVNV);
1265         break;
1266     case SVt_RV:
1267     case SVt_PV:
1268         sv_upgrade(sv, SVt_PVIV);
1269         break;
1270
1271     case SVt_PVGV:
1272     case SVt_PVAV:
1273     case SVt_PVHV:
1274     case SVt_PVCV:
1275     case SVt_PVFM:
1276     case SVt_PVIO:
1277         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1278                    OP_DESC(PL_op));
1279     }
1280     (void)SvIOK_only(sv);                       /* validate number */
1281     SvIV_set(sv, i);
1282     SvTAINT(sv);
1283 }
1284
1285 /*
1286 =for apidoc sv_setiv_mg
1287
1288 Like C<sv_setiv>, but also handles 'set' magic.
1289
1290 =cut
1291 */
1292
1293 void
1294 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1295 {
1296     sv_setiv(sv,i);
1297     SvSETMAGIC(sv);
1298 }
1299
1300 /*
1301 =for apidoc sv_setuv
1302
1303 Copies an unsigned integer into the given SV, upgrading first if necessary.
1304 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1305
1306 =cut
1307 */
1308
1309 void
1310 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1311 {
1312     /* With these two if statements:
1313        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1314
1315        without
1316        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1317
1318        If you wish to remove them, please benchmark to see what the effect is
1319     */
1320     if (u <= (UV)IV_MAX) {
1321        sv_setiv(sv, (IV)u);
1322        return;
1323     }
1324     sv_setiv(sv, 0);
1325     SvIsUV_on(sv);
1326     SvUV_set(sv, u);
1327 }
1328
1329 /*
1330 =for apidoc sv_setuv_mg
1331
1332 Like C<sv_setuv>, but also handles 'set' magic.
1333
1334 =cut
1335 */
1336
1337 void
1338 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1339 {
1340     sv_setiv(sv, 0);
1341     SvIsUV_on(sv);
1342     sv_setuv(sv,u);
1343     SvSETMAGIC(sv);
1344 }
1345
1346 /*
1347 =for apidoc sv_setnv
1348
1349 Copies a double into the given SV, upgrading first if necessary.
1350 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1351
1352 =cut
1353 */
1354
1355 void
1356 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1357 {
1358     SV_CHECK_THINKFIRST_COW_DROP(sv);
1359     switch (SvTYPE(sv)) {
1360     case SVt_NULL:
1361     case SVt_IV:
1362         sv_upgrade(sv, SVt_NV);
1363         break;
1364     case SVt_RV:
1365     case SVt_PV:
1366     case SVt_PVIV:
1367         sv_upgrade(sv, SVt_PVNV);
1368         break;
1369
1370     case SVt_PVGV:
1371     case SVt_PVAV:
1372     case SVt_PVHV:
1373     case SVt_PVCV:
1374     case SVt_PVFM:
1375     case SVt_PVIO:
1376         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1377                    OP_NAME(PL_op));
1378     }
1379     SvNV_set(sv, num);
1380     (void)SvNOK_only(sv);                       /* validate number */
1381     SvTAINT(sv);
1382 }
1383
1384 /*
1385 =for apidoc sv_setnv_mg
1386
1387 Like C<sv_setnv>, but also handles 'set' magic.
1388
1389 =cut
1390 */
1391
1392 void
1393 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1394 {
1395     sv_setnv(sv,num);
1396     SvSETMAGIC(sv);
1397 }
1398
1399 /* Print an "isn't numeric" warning, using a cleaned-up,
1400  * printable version of the offending string
1401  */
1402
1403 STATIC void
1404 S_not_a_number(pTHX_ SV *sv)
1405 {
1406      SV *dsv;
1407      char tmpbuf[64];
1408      const char *pv;
1409
1410      if (DO_UTF8(sv)) {
1411           dsv = sv_2mortal(newSVpvs(""));
1412           pv = sv_uni_display(dsv, sv, 10, 0);
1413      } else {
1414           char *d = tmpbuf;
1415           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1416           /* each *s can expand to 4 chars + "...\0",
1417              i.e. need room for 8 chars */
1418         
1419           const char *s = SvPVX_const(sv);
1420           const char * const end = s + SvCUR(sv);
1421           for ( ; s < end && d < limit; s++ ) {
1422                int ch = *s & 0xFF;
1423                if (ch & 128 && !isPRINT_LC(ch)) {
1424                     *d++ = 'M';
1425                     *d++ = '-';
1426                     ch &= 127;
1427                }
1428                if (ch == '\n') {
1429                     *d++ = '\\';
1430                     *d++ = 'n';
1431                }
1432                else if (ch == '\r') {
1433                     *d++ = '\\';
1434                     *d++ = 'r';
1435                }
1436                else if (ch == '\f') {
1437                     *d++ = '\\';
1438                     *d++ = 'f';
1439                }
1440                else if (ch == '\\') {
1441                     *d++ = '\\';
1442                     *d++ = '\\';
1443                }
1444                else if (ch == '\0') {
1445                     *d++ = '\\';
1446                     *d++ = '0';
1447                }
1448                else if (isPRINT_LC(ch))
1449                     *d++ = ch;
1450                else {
1451                     *d++ = '^';
1452                     *d++ = toCTRL(ch);
1453                }
1454           }
1455           if (s < end) {
1456                *d++ = '.';
1457                *d++ = '.';
1458                *d++ = '.';
1459           }
1460           *d = '\0';
1461           pv = tmpbuf;
1462     }
1463
1464     if (PL_op)
1465         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1466                     "Argument \"%s\" isn't numeric in %s", pv,
1467                     OP_DESC(PL_op));
1468     else
1469         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1470                     "Argument \"%s\" isn't numeric", pv);
1471 }
1472
1473 /*
1474 =for apidoc looks_like_number
1475
1476 Test if the content of an SV looks like a number (or is a number).
1477 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1478 non-numeric warning), even if your atof() doesn't grok them.
1479
1480 =cut
1481 */
1482
1483 I32
1484 Perl_looks_like_number(pTHX_ SV *sv)
1485 {
1486     register const char *sbegin;
1487     STRLEN len;
1488
1489     if (SvPOK(sv)) {
1490         sbegin = SvPVX_const(sv);
1491         len = SvCUR(sv);
1492     }
1493     else if (SvPOKp(sv))
1494         sbegin = SvPV_const(sv, len);
1495     else
1496         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1497     return grok_number(sbegin, len, NULL);
1498 }
1499
1500 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1501    until proven guilty, assume that things are not that bad... */
1502
1503 /*
1504    NV_PRESERVES_UV:
1505
1506    As 64 bit platforms often have an NV that doesn't preserve all bits of
1507    an IV (an assumption perl has been based on to date) it becomes necessary
1508    to remove the assumption that the NV always carries enough precision to
1509    recreate the IV whenever needed, and that the NV is the canonical form.
1510    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1511    precision as a side effect of conversion (which would lead to insanity
1512    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1513    1) to distinguish between IV/UV/NV slots that have cached a valid
1514       conversion where precision was lost and IV/UV/NV slots that have a
1515       valid conversion which has lost no precision
1516    2) to ensure that if a numeric conversion to one form is requested that
1517       would lose precision, the precise conversion (or differently
1518       imprecise conversion) is also performed and cached, to prevent
1519       requests for different numeric formats on the same SV causing
1520       lossy conversion chains. (lossless conversion chains are perfectly
1521       acceptable (still))
1522
1523
1524    flags are used:
1525    SvIOKp is true if the IV slot contains a valid value
1526    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1527    SvNOKp is true if the NV slot contains a valid value
1528    SvNOK  is true only if the NV value is accurate
1529
1530    so
1531    while converting from PV to NV, check to see if converting that NV to an
1532    IV(or UV) would lose accuracy over a direct conversion from PV to
1533    IV(or UV). If it would, cache both conversions, return NV, but mark
1534    SV as IOK NOKp (ie not NOK).
1535
1536    While converting from PV to IV, check to see if converting that IV to an
1537    NV would lose accuracy over a direct conversion from PV to NV. If it
1538    would, cache both conversions, flag similarly.
1539
1540    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1541    correctly because if IV & NV were set NV *always* overruled.
1542    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1543    changes - now IV and NV together means that the two are interchangeable:
1544    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1545
1546    The benefit of this is that operations such as pp_add know that if
1547    SvIOK is true for both left and right operands, then integer addition
1548    can be used instead of floating point (for cases where the result won't
1549    overflow). Before, floating point was always used, which could lead to
1550    loss of precision compared with integer addition.
1551
1552    * making IV and NV equal status should make maths accurate on 64 bit
1553      platforms
1554    * may speed up maths somewhat if pp_add and friends start to use
1555      integers when possible instead of fp. (Hopefully the overhead in
1556      looking for SvIOK and checking for overflow will not outweigh the
1557      fp to integer speedup)
1558    * will slow down integer operations (callers of SvIV) on "inaccurate"
1559      values, as the change from SvIOK to SvIOKp will cause a call into
1560      sv_2iv each time rather than a macro access direct to the IV slot
1561    * should speed up number->string conversion on integers as IV is
1562      favoured when IV and NV are equally accurate
1563
1564    ####################################################################
1565    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1566    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1567    On the other hand, SvUOK is true iff UV.
1568    ####################################################################
1569
1570    Your mileage will vary depending your CPU's relative fp to integer
1571    performance ratio.
1572 */
1573
1574 #ifndef NV_PRESERVES_UV
1575 #  define IS_NUMBER_UNDERFLOW_IV 1
1576 #  define IS_NUMBER_UNDERFLOW_UV 2
1577 #  define IS_NUMBER_IV_AND_UV    2
1578 #  define IS_NUMBER_OVERFLOW_IV  4
1579 #  define IS_NUMBER_OVERFLOW_UV  5
1580
1581 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1582
1583 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1584 STATIC int
1585 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1586 {
1587     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1588     if (SvNVX(sv) < (NV)IV_MIN) {
1589         (void)SvIOKp_on(sv);
1590         (void)SvNOK_on(sv);
1591         SvIV_set(sv, IV_MIN);
1592         return IS_NUMBER_UNDERFLOW_IV;
1593     }
1594     if (SvNVX(sv) > (NV)UV_MAX) {
1595         (void)SvIOKp_on(sv);
1596         (void)SvNOK_on(sv);
1597         SvIsUV_on(sv);
1598         SvUV_set(sv, UV_MAX);
1599         return IS_NUMBER_OVERFLOW_UV;
1600     }
1601     (void)SvIOKp_on(sv);
1602     (void)SvNOK_on(sv);
1603     /* Can't use strtol etc to convert this string.  (See truth table in
1604        sv_2iv  */
1605     if (SvNVX(sv) <= (UV)IV_MAX) {
1606         SvIV_set(sv, I_V(SvNVX(sv)));
1607         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1608             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1609         } else {
1610             /* Integer is imprecise. NOK, IOKp */
1611         }
1612         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1613     }
1614     SvIsUV_on(sv);
1615     SvUV_set(sv, U_V(SvNVX(sv)));
1616     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1617         if (SvUVX(sv) == UV_MAX) {
1618             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1619                possibly be preserved by NV. Hence, it must be overflow.
1620                NOK, IOKp */
1621             return IS_NUMBER_OVERFLOW_UV;
1622         }
1623         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1624     } else {
1625         /* Integer is imprecise. NOK, IOKp */
1626     }
1627     return IS_NUMBER_OVERFLOW_IV;
1628 }
1629 #endif /* !NV_PRESERVES_UV*/
1630
1631 STATIC bool
1632 S_sv_2iuv_common(pTHX_ SV *sv) {
1633     if (SvNOKp(sv)) {
1634         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1635          * without also getting a cached IV/UV from it at the same time
1636          * (ie PV->NV conversion should detect loss of accuracy and cache
1637          * IV or UV at same time to avoid this. */
1638         /* IV-over-UV optimisation - choose to cache IV if possible */
1639
1640         if (SvTYPE(sv) == SVt_NV)
1641             sv_upgrade(sv, SVt_PVNV);
1642
1643         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1644         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1645            certainly cast into the IV range at IV_MAX, whereas the correct
1646            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1647            cases go to UV */
1648         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1649             SvIV_set(sv, I_V(SvNVX(sv)));
1650             if (SvNVX(sv) == (NV) SvIVX(sv)
1651 #ifndef NV_PRESERVES_UV
1652                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1653                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1654                 /* Don't flag it as "accurately an integer" if the number
1655                    came from a (by definition imprecise) NV operation, and
1656                    we're outside the range of NV integer precision */
1657 #endif
1658                 ) {
1659                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1660                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1661                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1662                                       PTR2UV(sv),
1663                                       SvNVX(sv),
1664                                       SvIVX(sv)));
1665
1666             } else {
1667                 /* IV not precise.  No need to convert from PV, as NV
1668                    conversion would already have cached IV if it detected
1669                    that PV->IV would be better than PV->NV->IV
1670                    flags already correct - don't set public IOK.  */
1671                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1672                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1673                                       PTR2UV(sv),
1674                                       SvNVX(sv),
1675                                       SvIVX(sv)));
1676             }
1677             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1678                but the cast (NV)IV_MIN rounds to a the value less (more
1679                negative) than IV_MIN which happens to be equal to SvNVX ??
1680                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1681                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1682                (NV)UVX == NVX are both true, but the values differ. :-(
1683                Hopefully for 2s complement IV_MIN is something like
1684                0x8000000000000000 which will be exact. NWC */
1685         }
1686         else {
1687             SvUV_set(sv, U_V(SvNVX(sv)));
1688             if (
1689                 (SvNVX(sv) == (NV) SvUVX(sv))
1690 #ifndef  NV_PRESERVES_UV
1691                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1692                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1693                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1694                 /* Don't flag it as "accurately an integer" if the number
1695                    came from a (by definition imprecise) NV operation, and
1696                    we're outside the range of NV integer precision */
1697 #endif
1698                 )
1699                 SvIOK_on(sv);
1700             SvIsUV_on(sv);
1701             DEBUG_c(PerlIO_printf(Perl_debug_log,
1702                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1703                                   PTR2UV(sv),
1704                                   SvUVX(sv),
1705                                   SvUVX(sv)));
1706         }
1707     }
1708     else if (SvPOKp(sv) && SvLEN(sv)) {
1709         UV value;
1710         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1711         /* We want to avoid a possible problem when we cache an IV/ a UV which
1712            may be later translated to an NV, and the resulting NV is not
1713            the same as the direct translation of the initial string
1714            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1715            be careful to ensure that the value with the .456 is around if the
1716            NV value is requested in the future).
1717         
1718            This means that if we cache such an IV/a UV, we need to cache the
1719            NV as well.  Moreover, we trade speed for space, and do not
1720            cache the NV if we are sure it's not needed.
1721          */
1722
1723         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1724         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1725              == IS_NUMBER_IN_UV) {
1726             /* It's definitely an integer, only upgrade to PVIV */
1727             if (SvTYPE(sv) < SVt_PVIV)
1728                 sv_upgrade(sv, SVt_PVIV);
1729             (void)SvIOK_on(sv);
1730         } else if (SvTYPE(sv) < SVt_PVNV)
1731             sv_upgrade(sv, SVt_PVNV);
1732
1733         /* If NVs preserve UVs then we only use the UV value if we know that
1734            we aren't going to call atof() below. If NVs don't preserve UVs
1735            then the value returned may have more precision than atof() will
1736            return, even though value isn't perfectly accurate.  */
1737         if ((numtype & (IS_NUMBER_IN_UV
1738 #ifdef NV_PRESERVES_UV
1739                         | IS_NUMBER_NOT_INT
1740 #endif
1741             )) == IS_NUMBER_IN_UV) {
1742             /* This won't turn off the public IOK flag if it was set above  */
1743             (void)SvIOKp_on(sv);
1744
1745             if (!(numtype & IS_NUMBER_NEG)) {
1746                 /* positive */;
1747                 if (value <= (UV)IV_MAX) {
1748                     SvIV_set(sv, (IV)value);
1749                 } else {
1750                     /* it didn't overflow, and it was positive. */
1751                     SvUV_set(sv, value);
1752                     SvIsUV_on(sv);
1753                 }
1754             } else {
1755                 /* 2s complement assumption  */
1756                 if (value <= (UV)IV_MIN) {
1757                     SvIV_set(sv, -(IV)value);
1758                 } else {
1759                     /* Too negative for an IV.  This is a double upgrade, but
1760                        I'm assuming it will be rare.  */
1761                     if (SvTYPE(sv) < SVt_PVNV)
1762                         sv_upgrade(sv, SVt_PVNV);
1763                     SvNOK_on(sv);
1764                     SvIOK_off(sv);
1765                     SvIOKp_on(sv);
1766                     SvNV_set(sv, -(NV)value);
1767                     SvIV_set(sv, IV_MIN);
1768                 }
1769             }
1770         }
1771         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1772            will be in the previous block to set the IV slot, and the next
1773            block to set the NV slot.  So no else here.  */
1774         
1775         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1776             != IS_NUMBER_IN_UV) {
1777             /* It wasn't an (integer that doesn't overflow the UV). */
1778             SvNV_set(sv, Atof(SvPVX_const(sv)));
1779
1780             if (! numtype && ckWARN(WARN_NUMERIC))
1781                 not_a_number(sv);
1782
1783 #if defined(USE_LONG_DOUBLE)
1784             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1785                                   PTR2UV(sv), SvNVX(sv)));
1786 #else
1787             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1788                                   PTR2UV(sv), SvNVX(sv)));
1789 #endif
1790
1791 #ifdef NV_PRESERVES_UV
1792             (void)SvIOKp_on(sv);
1793             (void)SvNOK_on(sv);
1794             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1795                 SvIV_set(sv, I_V(SvNVX(sv)));
1796                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1797                     SvIOK_on(sv);
1798                 } else {
1799                     /* Integer is imprecise. NOK, IOKp */
1800                 }
1801                 /* UV will not work better than IV */
1802             } else {
1803                 if (SvNVX(sv) > (NV)UV_MAX) {
1804                     SvIsUV_on(sv);
1805                     /* Integer is inaccurate. NOK, IOKp, is UV */
1806                     SvUV_set(sv, UV_MAX);
1807                 } else {
1808                     SvUV_set(sv, U_V(SvNVX(sv)));
1809                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
1810                        NV preservse UV so can do correct comparison.  */
1811                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1812                         SvIOK_on(sv);
1813                     } else {
1814                         /* Integer is imprecise. NOK, IOKp, is UV */
1815                     }
1816                 }
1817                 SvIsUV_on(sv);
1818             }
1819 #else /* NV_PRESERVES_UV */
1820             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1821                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1822                 /* The IV/UV slot will have been set from value returned by
1823                    grok_number above.  The NV slot has just been set using
1824                    Atof.  */
1825                 SvNOK_on(sv);
1826                 assert (SvIOKp(sv));
1827             } else {
1828                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1829                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1830                     /* Small enough to preserve all bits. */
1831                     (void)SvIOKp_on(sv);
1832                     SvNOK_on(sv);
1833                     SvIV_set(sv, I_V(SvNVX(sv)));
1834                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1835                         SvIOK_on(sv);
1836                     /* Assumption: first non-preserved integer is < IV_MAX,
1837                        this NV is in the preserved range, therefore: */
1838                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1839                           < (UV)IV_MAX)) {
1840                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1841                     }
1842                 } else {
1843                     /* IN_UV NOT_INT
1844                          0      0       already failed to read UV.
1845                          0      1       already failed to read UV.
1846                          1      0       you won't get here in this case. IV/UV
1847                                         slot set, public IOK, Atof() unneeded.
1848                          1      1       already read UV.
1849                        so there's no point in sv_2iuv_non_preserve() attempting
1850                        to use atol, strtol, strtoul etc.  */
1851                     sv_2iuv_non_preserve (sv, numtype);
1852                 }
1853             }
1854 #endif /* NV_PRESERVES_UV */
1855         }
1856     }
1857     else  {
1858         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1859             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1860                 report_uninit(sv);
1861         }
1862         if (SvTYPE(sv) < SVt_IV)
1863             /* Typically the caller expects that sv_any is not NULL now.  */
1864             sv_upgrade(sv, SVt_IV);
1865         /* Return 0 from the caller.  */
1866         return TRUE;
1867     }
1868     return FALSE;
1869 }
1870
1871 /*
1872 =for apidoc sv_2iv_flags
1873
1874 Return the integer value of an SV, doing any necessary string
1875 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1876 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1877
1878 =cut
1879 */
1880
1881 IV
1882 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1883 {
1884     if (!sv)
1885         return 0;
1886     if (SvGMAGICAL(sv)) {
1887         if (flags & SV_GMAGIC)
1888             mg_get(sv);
1889         if (SvIOKp(sv))
1890             return SvIVX(sv);
1891         if (SvNOKp(sv)) {
1892             return I_V(SvNVX(sv));
1893         }
1894         if (SvPOKp(sv) && SvLEN(sv)) {
1895             UV value;
1896             const int numtype
1897                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1898
1899             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1900                 == IS_NUMBER_IN_UV) {
1901                 /* It's definitely an integer */
1902                 if (numtype & IS_NUMBER_NEG) {
1903                     if (value < (UV)IV_MIN)
1904                         return -(IV)value;
1905                 } else {
1906                     if (value < (UV)IV_MAX)
1907                         return (IV)value;
1908                 }
1909             }
1910             if (!numtype) {
1911                 if (ckWARN(WARN_NUMERIC))
1912                     not_a_number(sv);
1913             }
1914             return I_V(Atof(SvPVX_const(sv)));
1915         }
1916         if (SvROK(sv)) {
1917             goto return_rok;
1918         }
1919         assert(SvTYPE(sv) >= SVt_PVMG);
1920         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
1921     } else if (SvTHINKFIRST(sv)) {
1922         if (SvROK(sv)) {
1923         return_rok:
1924             if (SvAMAGIC(sv)) {
1925                 SV * const tmpstr=AMG_CALLun(sv,numer);
1926                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1927                     return SvIV(tmpstr);
1928                 }
1929             }
1930             return PTR2IV(SvRV(sv));
1931         }
1932         if (SvIsCOW(sv)) {
1933             sv_force_normal_flags(sv, 0);
1934         }
1935         if (SvREADONLY(sv) && !SvOK(sv)) {
1936             if (ckWARN(WARN_UNINITIALIZED))
1937                 report_uninit(sv);
1938             return 0;
1939         }
1940     }
1941     if (!SvIOKp(sv)) {
1942         if (S_sv_2iuv_common(aTHX_ sv))
1943             return 0;
1944     }
1945     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1946         PTR2UV(sv),SvIVX(sv)));
1947     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1948 }
1949
1950 /*
1951 =for apidoc sv_2uv_flags
1952
1953 Return the unsigned integer value of an SV, doing any necessary string
1954 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1955 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1956
1957 =cut
1958 */
1959
1960 UV
1961 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1962 {
1963     if (!sv)
1964         return 0;
1965     if (SvGMAGICAL(sv)) {
1966         if (flags & SV_GMAGIC)
1967             mg_get(sv);
1968         if (SvIOKp(sv))
1969             return SvUVX(sv);
1970         if (SvNOKp(sv))
1971             return U_V(SvNVX(sv));
1972         if (SvPOKp(sv) && SvLEN(sv)) {
1973             UV value;
1974             const int numtype
1975                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1976
1977             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1978                 == IS_NUMBER_IN_UV) {
1979                 /* It's definitely an integer */
1980                 if (!(numtype & IS_NUMBER_NEG))
1981                     return value;
1982             }
1983             if (!numtype) {
1984                 if (ckWARN(WARN_NUMERIC))
1985                     not_a_number(sv);
1986             }
1987             return U_V(Atof(SvPVX_const(sv)));
1988         }
1989         if (SvROK(sv)) {
1990             goto return_rok;
1991         }
1992         assert(SvTYPE(sv) >= SVt_PVMG);
1993         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
1994     } else if (SvTHINKFIRST(sv)) {
1995         if (SvROK(sv)) {
1996         return_rok:
1997             if (SvAMAGIC(sv)) {
1998                 SV *const tmpstr = AMG_CALLun(sv,numer);
1999                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2000                     return SvUV(tmpstr);
2001                 }
2002             }
2003             return PTR2UV(SvRV(sv));
2004         }
2005         if (SvIsCOW(sv)) {
2006             sv_force_normal_flags(sv, 0);
2007         }
2008         if (SvREADONLY(sv) && !SvOK(sv)) {
2009             if (ckWARN(WARN_UNINITIALIZED))
2010                 report_uninit(sv);
2011             return 0;
2012         }
2013     }
2014     if (!SvIOKp(sv)) {
2015         if (S_sv_2iuv_common(aTHX_ sv))
2016             return 0;
2017     }
2018
2019     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2020                           PTR2UV(sv),SvUVX(sv)));
2021     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2022 }
2023
2024 /*
2025 =for apidoc sv_2nv
2026
2027 Return the num value of an SV, doing any necessary string or integer
2028 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2029 macros.
2030
2031 =cut
2032 */
2033
2034 NV
2035 Perl_sv_2nv(pTHX_ register SV *sv)
2036 {
2037     if (!sv)
2038         return 0.0;
2039     if (SvGMAGICAL(sv)) {
2040         mg_get(sv);
2041         if (SvNOKp(sv))
2042             return SvNVX(sv);
2043         if (SvPOKp(sv) && SvLEN(sv)) {
2044             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2045                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2046                 not_a_number(sv);
2047             return Atof(SvPVX_const(sv));
2048         }
2049         if (SvIOKp(sv)) {
2050             if (SvIsUV(sv))
2051                 return (NV)SvUVX(sv);
2052             else
2053                 return (NV)SvIVX(sv);
2054         }
2055         if (SvROK(sv)) {
2056             goto return_rok;
2057         }
2058         assert(SvTYPE(sv) >= SVt_PVMG);
2059         /* This falls through to the report_uninit near the end of the
2060            function. */
2061     } else if (SvTHINKFIRST(sv)) {
2062         if (SvROK(sv)) {
2063         return_rok:
2064             if (SvAMAGIC(sv)) {
2065                 SV *const tmpstr = AMG_CALLun(sv,numer);
2066                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2067                     return SvNV(tmpstr);
2068                 }
2069             }
2070             return PTR2NV(SvRV(sv));
2071         }
2072         if (SvIsCOW(sv)) {
2073             sv_force_normal_flags(sv, 0);
2074         }
2075         if (SvREADONLY(sv) && !SvOK(sv)) {
2076             if (ckWARN(WARN_UNINITIALIZED))
2077                 report_uninit(sv);
2078             return 0.0;
2079         }
2080     }
2081     if (SvTYPE(sv) < SVt_NV) {
2082         /* The logic to use SVt_PVNV if necessary is in sv_upgrade.  */
2083         sv_upgrade(sv, SVt_NV);
2084 #ifdef USE_LONG_DOUBLE
2085         DEBUG_c({
2086             STORE_NUMERIC_LOCAL_SET_STANDARD();
2087             PerlIO_printf(Perl_debug_log,
2088                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2089                           PTR2UV(sv), SvNVX(sv));
2090             RESTORE_NUMERIC_LOCAL();
2091         });
2092 #else
2093         DEBUG_c({
2094             STORE_NUMERIC_LOCAL_SET_STANDARD();
2095             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2096                           PTR2UV(sv), SvNVX(sv));
2097             RESTORE_NUMERIC_LOCAL();
2098         });
2099 #endif
2100     }
2101     else if (SvTYPE(sv) < SVt_PVNV)
2102         sv_upgrade(sv, SVt_PVNV);
2103     if (SvNOKp(sv)) {
2104         return SvNVX(sv);
2105     }
2106     if (SvIOKp(sv)) {
2107         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2108 #ifdef NV_PRESERVES_UV
2109         SvNOK_on(sv);
2110 #else
2111         /* Only set the public NV OK flag if this NV preserves the IV  */
2112         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2113         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2114                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2115             SvNOK_on(sv);
2116         else
2117             SvNOKp_on(sv);
2118 #endif
2119     }
2120     else if (SvPOKp(sv) && SvLEN(sv)) {
2121         UV value;
2122         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2123         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2124             not_a_number(sv);
2125 #ifdef NV_PRESERVES_UV
2126         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2127             == IS_NUMBER_IN_UV) {
2128             /* It's definitely an integer */
2129             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2130         } else
2131             SvNV_set(sv, Atof(SvPVX_const(sv)));
2132         SvNOK_on(sv);
2133 #else
2134         SvNV_set(sv, Atof(SvPVX_const(sv)));
2135         /* Only set the public NV OK flag if this NV preserves the value in
2136            the PV at least as well as an IV/UV would.
2137            Not sure how to do this 100% reliably. */
2138         /* if that shift count is out of range then Configure's test is
2139            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2140            UV_BITS */
2141         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2142             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2143             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2144         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2145             /* Can't use strtol etc to convert this string, so don't try.
2146                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2147             SvNOK_on(sv);
2148         } else {
2149             /* value has been set.  It may not be precise.  */
2150             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2151                 /* 2s complement assumption for (UV)IV_MIN  */
2152                 SvNOK_on(sv); /* Integer is too negative.  */
2153             } else {
2154                 SvNOKp_on(sv);
2155                 SvIOKp_on(sv);
2156
2157                 if (numtype & IS_NUMBER_NEG) {
2158                     SvIV_set(sv, -(IV)value);
2159                 } else if (value <= (UV)IV_MAX) {
2160                     SvIV_set(sv, (IV)value);
2161                 } else {
2162                     SvUV_set(sv, value);
2163                     SvIsUV_on(sv);
2164                 }
2165
2166                 if (numtype & IS_NUMBER_NOT_INT) {
2167                     /* I believe that even if the original PV had decimals,
2168                        they are lost beyond the limit of the FP precision.
2169                        However, neither is canonical, so both only get p
2170                        flags.  NWC, 2000/11/25 */
2171                     /* Both already have p flags, so do nothing */
2172                 } else {
2173                     const NV nv = SvNVX(sv);
2174                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2175                         if (SvIVX(sv) == I_V(nv)) {
2176                             SvNOK_on(sv);
2177                         } else {
2178                             /* It had no "." so it must be integer.  */
2179                         }
2180                         SvIOK_on(sv);
2181                     } else {
2182                         /* between IV_MAX and NV(UV_MAX).
2183                            Could be slightly > UV_MAX */
2184
2185                         if (numtype & IS_NUMBER_NOT_INT) {
2186                             /* UV and NV both imprecise.  */
2187                         } else {
2188                             const UV nv_as_uv = U_V(nv);
2189
2190                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2191                                 SvNOK_on(sv);
2192                             }
2193                             SvIOK_on(sv);
2194                         }
2195                     }
2196                 }
2197             }
2198         }
2199 #endif /* NV_PRESERVES_UV */
2200     }
2201     else  {
2202         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2203             report_uninit(sv);
2204         assert (SvTYPE(sv) >= SVt_NV);
2205         /* Typically the caller expects that sv_any is not NULL now.  */
2206         /* XXX Ilya implies that this is a bug in callers that assume this
2207            and ideally should be fixed.  */
2208         return 0.0;
2209     }
2210 #if defined(USE_LONG_DOUBLE)
2211     DEBUG_c({
2212         STORE_NUMERIC_LOCAL_SET_STANDARD();
2213         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2214                       PTR2UV(sv), SvNVX(sv));
2215         RESTORE_NUMERIC_LOCAL();
2216     });
2217 #else
2218     DEBUG_c({
2219         STORE_NUMERIC_LOCAL_SET_STANDARD();
2220         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2221                       PTR2UV(sv), SvNVX(sv));
2222         RESTORE_NUMERIC_LOCAL();
2223     });
2224 #endif
2225     return SvNVX(sv);
2226 }
2227
2228 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2229  * UV as a string towards the end of buf, and return pointers to start and
2230  * end of it.
2231  *
2232  * We assume that buf is at least TYPE_CHARS(UV) long.
2233  */
2234
2235 static char *
2236 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2237 {
2238     char *ptr = buf + TYPE_CHARS(UV);
2239     char * const ebuf = ptr;
2240     int sign;
2241
2242     if (is_uv)
2243         sign = 0;
2244     else if (iv >= 0) {
2245         uv = iv;
2246         sign = 0;
2247     } else {
2248         uv = -iv;
2249         sign = 1;
2250     }
2251     do {
2252         *--ptr = '0' + (char)(uv % 10);
2253     } while (uv /= 10);
2254     if (sign)
2255         *--ptr = '-';
2256     *peob = ebuf;
2257     return ptr;
2258 }
2259
2260 /* stringify_regexp(): private routine for use by sv_2pv_flags(): converts
2261  * a regexp to its stringified form.
2262  */
2263
2264 static char *
2265 S_stringify_regexp(pTHX_ SV *sv, MAGIC *mg, STRLEN *lp) {
2266     const regexp * const re = (regexp *)mg->mg_obj;
2267
2268     if (!mg->mg_ptr) {
2269         const char *fptr = "msix";
2270         char reflags[6];
2271         char ch;
2272         int left = 0;
2273         int right = 4;
2274         bool need_newline = 0;
2275         U16 reganch = (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2276
2277         while((ch = *fptr++)) {
2278             if(reganch & 1) {
2279                 reflags[left++] = ch;
2280             }
2281             else {
2282                 reflags[right--] = ch;
2283             }
2284             reganch >>= 1;
2285         }
2286         if(left != 4) {
2287             reflags[left] = '-';
2288             left = 5;
2289         }
2290
2291         mg->mg_len = re->prelen + 4 + left;
2292         /*
2293          * If /x was used, we have to worry about a regex ending with a
2294          * comment later being embedded within another regex. If so, we don't
2295          * want this regex's "commentization" to leak out to the right part of
2296          * the enclosing regex, we must cap it with a newline.
2297          *
2298          * So, if /x was used, we scan backwards from the end of the regex. If
2299          * we find a '#' before we find a newline, we need to add a newline
2300          * ourself. If we find a '\n' first (or if we don't find '#' or '\n'),
2301          * we don't need to add anything.  -jfriedl
2302          */
2303         if (PMf_EXTENDED & re->reganch) {
2304             const char *endptr = re->precomp + re->prelen;
2305             while (endptr >= re->precomp) {
2306                 const char c = *(endptr--);
2307                 if (c == '\n')
2308                     break; /* don't need another */
2309                 if (c == '#') {
2310                     /* we end while in a comment, so we need a newline */
2311                     mg->mg_len++; /* save space for it */
2312                     need_newline = 1; /* note to add it */
2313                     break;
2314                 }
2315             }
2316         }
2317
2318         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2319         mg->mg_ptr[0] = '(';
2320         mg->mg_ptr[1] = '?';
2321         Copy(reflags, mg->mg_ptr+2, left, char);
2322         *(mg->mg_ptr+left+2) = ':';
2323         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2324         if (need_newline)
2325             mg->mg_ptr[mg->mg_len - 2] = '\n';
2326         mg->mg_ptr[mg->mg_len - 1] = ')';
2327         mg->mg_ptr[mg->mg_len] = 0;
2328     }
2329     PL_reginterp_cnt += re->program[0].next_off;
2330     
2331     if (re->reganch & ROPT_UTF8)
2332         SvUTF8_on(sv);
2333     else
2334         SvUTF8_off(sv);
2335     if (lp)
2336         *lp = mg->mg_len;
2337     return mg->mg_ptr;
2338 }
2339
2340 /*
2341 =for apidoc sv_2pv_flags
2342
2343 Returns a pointer to the string value of an SV, and sets *lp to its length.
2344 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2345 if necessary.
2346 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2347 usually end up here too.
2348
2349 =cut
2350 */
2351
2352 char *
2353 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2354 {
2355     register char *s;
2356
2357     if (!sv) {
2358         if (lp)
2359             *lp = 0;
2360         return (char *)"";
2361     }
2362     if (SvGMAGICAL(sv)) {
2363         if (flags & SV_GMAGIC)
2364             mg_get(sv);
2365         if (SvPOKp(sv)) {
2366             if (lp)
2367                 *lp = SvCUR(sv);
2368             if (flags & SV_MUTABLE_RETURN)
2369                 return SvPVX_mutable(sv);
2370             if (flags & SV_CONST_RETURN)
2371                 return (char *)SvPVX_const(sv);
2372             return SvPVX(sv);
2373         }
2374         if (SvIOKp(sv) || SvNOKp(sv)) {
2375             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2376             STRLEN len;
2377
2378             if (SvIOKp(sv)) {
2379                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2380                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2381             } else {
2382                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2383                 len = strlen(tbuf);
2384             }
2385             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2386                 /* Sneaky stuff here */
2387                 SV * const tsv = newSVpvn(tbuf, len);
2388
2389                 sv_2mortal(tsv);
2390                 if (lp)
2391                     *lp = SvCUR(tsv);
2392                 return SvPVX(tsv);
2393             }
2394             else {
2395                 dVAR;
2396
2397 #ifdef FIXNEGATIVEZERO
2398                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2399                     tbuf[0] = '0';
2400                     tbuf[1] = 0;
2401                     len = 1;
2402                 }
2403 #endif
2404                 SvUPGRADE(sv, SVt_PV);
2405                 if (lp)
2406                     *lp = len;
2407                 s = SvGROW_mutable(sv, len + 1);
2408                 SvCUR_set(sv, len);
2409                 SvPOKp_on(sv);
2410                 return memcpy(s, tbuf, len + 1);
2411             }
2412         }
2413         if (SvROK(sv)) {
2414             goto return_rok;
2415         }
2416         assert(SvTYPE(sv) >= SVt_PVMG);
2417         /* This falls through to the report_uninit near the end of the
2418            function. */
2419     } else if (SvTHINKFIRST(sv)) {
2420         if (SvROK(sv)) {
2421         return_rok:
2422             if (SvAMAGIC(sv)) {
2423                 SV *const tmpstr = AMG_CALLun(sv,string);
2424                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2425                     /* Unwrap this:  */
2426                     /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr);
2427                      */
2428
2429                     char *pv;
2430                     if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2431                         if (flags & SV_CONST_RETURN) {
2432                             pv = (char *) SvPVX_const(tmpstr);
2433                         } else {
2434                             pv = (flags & SV_MUTABLE_RETURN)
2435                                 ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2436                         }
2437                         if (lp)
2438                             *lp = SvCUR(tmpstr);
2439                     } else {
2440                         pv = sv_2pv_flags(tmpstr, lp, flags);
2441                     }
2442                     if (SvUTF8(tmpstr))
2443                         SvUTF8_on(sv);
2444                     else
2445                         SvUTF8_off(sv);
2446                     return pv;
2447                 }
2448             }
2449             {
2450                 SV *tsv;
2451                 MAGIC *mg;
2452                 const SV *const referent = (SV*)SvRV(sv);
2453
2454                 if (!referent) {
2455                     tsv = sv_2mortal(newSVpvs("NULLREF"));
2456                 } else if (SvTYPE(referent) == SVt_PVMG
2457                            && ((SvFLAGS(referent) &
2458                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2459                                == (SVs_OBJECT|SVs_SMG))
2460                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2461                     return stringify_regexp(sv, mg, lp);
2462                 } else {
2463                     const char *const typestr = sv_reftype(referent, 0);
2464
2465                     tsv = sv_newmortal();
2466                     if (SvOBJECT(referent)) {
2467                         const char *const name = HvNAME_get(SvSTASH(referent));
2468                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2469                                        name ? name : "__ANON__" , typestr,
2470                                        PTR2UV(referent));
2471                     }
2472                     else
2473                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2474                                        PTR2UV(referent));
2475                 }
2476                 if (lp)
2477                     *lp = SvCUR(tsv);
2478                 return SvPVX(tsv);
2479             }
2480         }
2481         if (SvREADONLY(sv) && !SvOK(sv)) {
2482             if (ckWARN(WARN_UNINITIALIZED))
2483                 report_uninit(sv);
2484             if (lp)
2485                 *lp = 0;
2486             return (char *)"";
2487         }
2488     }
2489     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2490         /* I'm assuming that if both IV and NV are equally valid then
2491            converting the IV is going to be more efficient */
2492         const U32 isIOK = SvIOK(sv);
2493         const U32 isUIOK = SvIsUV(sv);
2494         char buf[TYPE_CHARS(UV)];
2495         char *ebuf, *ptr;
2496
2497         if (SvTYPE(sv) < SVt_PVIV)
2498             sv_upgrade(sv, SVt_PVIV);
2499         ptr = uiv_2buf(buf, SvIVX(sv), SvUVX(sv), isUIOK, &ebuf);
2500         /* inlined from sv_setpvn */
2501         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2502         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2503         SvCUR_set(sv, ebuf - ptr);
2504         s = SvEND(sv);
2505         *s = '\0';
2506         if (isIOK)
2507             SvIOK_on(sv);
2508         else
2509             SvIOKp_on(sv);
2510         if (isUIOK)
2511             SvIsUV_on(sv);
2512     }
2513     else if (SvNOKp(sv)) {
2514         const int olderrno = errno;
2515         if (SvTYPE(sv) < SVt_PVNV)
2516             sv_upgrade(sv, SVt_PVNV);
2517         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2518         s = SvGROW_mutable(sv, NV_DIG + 20);
2519         /* some Xenix systems wipe out errno here */
2520 #ifdef apollo
2521         if (SvNVX(sv) == 0.0)
2522             (void)strcpy(s,"0");
2523         else
2524 #endif /*apollo*/
2525         {
2526             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2527         }
2528         errno = olderrno;
2529 #ifdef FIXNEGATIVEZERO
2530         if (*s == '-' && s[1] == '0' && !s[2])
2531             strcpy(s,"0");
2532 #endif
2533         while (*s) s++;
2534 #ifdef hcx
2535         if (s[-1] == '.')
2536             *--s = '\0';
2537 #endif
2538     }
2539     else {
2540         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2541             report_uninit(sv);
2542         if (lp)
2543             *lp = 0;
2544         if (SvTYPE(sv) < SVt_PV)
2545             /* Typically the caller expects that sv_any is not NULL now.  */
2546             sv_upgrade(sv, SVt_PV);
2547         return (char *)"";
2548     }
2549     {
2550         const STRLEN len = s - SvPVX_const(sv);
2551         if (lp) 
2552             *lp = len;
2553         SvCUR_set(sv, len);
2554     }
2555     SvPOK_on(sv);
2556     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2557                           PTR2UV(sv),SvPVX_const(sv)));
2558     if (flags & SV_CONST_RETURN)
2559         return (char *)SvPVX_const(sv);
2560     if (flags & SV_MUTABLE_RETURN)
2561         return SvPVX_mutable(sv);
2562     return SvPVX(sv);
2563 }
2564
2565 /*
2566 =for apidoc sv_copypv
2567
2568 Copies a stringified representation of the source SV into the
2569 destination SV.  Automatically performs any necessary mg_get and
2570 coercion of numeric values into strings.  Guaranteed to preserve
2571 UTF-8 flag even from overloaded objects.  Similar in nature to
2572 sv_2pv[_flags] but operates directly on an SV instead of just the
2573 string.  Mostly uses sv_2pv_flags to do its work, except when that
2574 would lose the UTF-8'ness of the PV.
2575
2576 =cut
2577 */
2578
2579 void
2580 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2581 {
2582     STRLEN len;
2583     const char * const s = SvPV_const(ssv,len);
2584     sv_setpvn(dsv,s,len);
2585     if (SvUTF8(ssv))
2586         SvUTF8_on(dsv);
2587     else
2588         SvUTF8_off(dsv);
2589 }
2590
2591 /*
2592 =for apidoc sv_2pvbyte
2593
2594 Return a pointer to the byte-encoded representation of the SV, and set *lp
2595 to its length.  May cause the SV to be downgraded from UTF-8 as a
2596 side-effect.
2597
2598 Usually accessed via the C<SvPVbyte> macro.
2599
2600 =cut
2601 */
2602
2603 char *
2604 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2605 {
2606     sv_utf8_downgrade(sv,0);
2607     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2608 }
2609
2610 /*
2611 =for apidoc sv_2pvutf8
2612
2613 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2614 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2615
2616 Usually accessed via the C<SvPVutf8> macro.
2617
2618 =cut
2619 */
2620
2621 char *
2622 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2623 {
2624     sv_utf8_upgrade(sv);
2625     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2626 }
2627
2628
2629 /*
2630 =for apidoc sv_2bool
2631
2632 This function is only called on magical items, and is only used by
2633 sv_true() or its macro equivalent.
2634
2635 =cut
2636 */
2637
2638 bool
2639 Perl_sv_2bool(pTHX_ register SV *sv)
2640 {
2641     SvGETMAGIC(sv);
2642
2643     if (!SvOK(sv))
2644         return 0;
2645     if (SvROK(sv)) {
2646         if (SvAMAGIC(sv)) {
2647             SV * const tmpsv = AMG_CALLun(sv,bool_);
2648             if (tmpsv && (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2649                 return (bool)SvTRUE(tmpsv);
2650         }
2651         return SvRV(sv) != 0;
2652     }
2653     if (SvPOKp(sv)) {
2654         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2655         if (Xpvtmp &&
2656                 (*sv->sv_u.svu_pv > '0' ||
2657                 Xpvtmp->xpv_cur > 1 ||
2658                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2659             return 1;
2660         else
2661             return 0;
2662     }
2663     else {
2664         if (SvIOKp(sv))
2665             return SvIVX(sv) != 0;
2666         else {
2667             if (SvNOKp(sv))
2668                 return SvNVX(sv) != 0.0;
2669             else
2670                 return FALSE;
2671         }
2672     }
2673 }
2674
2675 /*
2676 =for apidoc sv_utf8_upgrade
2677
2678 Converts the PV of an SV to its UTF-8-encoded form.
2679 Forces the SV to string form if it is not already.
2680 Always sets the SvUTF8 flag to avoid future validity checks even
2681 if all the bytes have hibit clear.
2682
2683 This is not as a general purpose byte encoding to Unicode interface:
2684 use the Encode extension for that.
2685
2686 =for apidoc sv_utf8_upgrade_flags
2687
2688 Converts the PV of an SV to its UTF-8-encoded form.
2689 Forces the SV to string form if it is not already.
2690 Always sets the SvUTF8 flag to avoid future validity checks even
2691 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2692 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2693 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2694
2695 This is not as a general purpose byte encoding to Unicode interface:
2696 use the Encode extension for that.
2697
2698 =cut
2699 */
2700
2701 STRLEN
2702 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2703 {
2704     if (sv == &PL_sv_undef)
2705         return 0;
2706     if (!SvPOK(sv)) {
2707         STRLEN len = 0;
2708         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2709             (void) sv_2pv_flags(sv,&len, flags);
2710             if (SvUTF8(sv))
2711                 return len;
2712         } else {
2713             (void) SvPV_force(sv,len);
2714         }
2715     }
2716
2717     if (SvUTF8(sv)) {
2718         return SvCUR(sv);
2719     }
2720
2721     if (SvIsCOW(sv)) {
2722         sv_force_normal_flags(sv, 0);
2723     }
2724
2725     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2726         sv_recode_to_utf8(sv, PL_encoding);
2727     else { /* Assume Latin-1/EBCDIC */
2728         /* This function could be much more efficient if we
2729          * had a FLAG in SVs to signal if there are any hibit
2730          * chars in the PV.  Given that there isn't such a flag
2731          * make the loop as fast as possible. */
2732         const U8 * const s = (U8 *) SvPVX_const(sv);
2733         const U8 * const e = (U8 *) SvEND(sv);
2734         const U8 *t = s;
2735         
2736         while (t < e) {
2737             const U8 ch = *t++;
2738             /* Check for hi bit */
2739             if (!NATIVE_IS_INVARIANT(ch)) {
2740                 STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2741                 U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2742
2743                 SvPV_free(sv); /* No longer using what was there before. */
2744                 SvPV_set(sv, (char*)recoded);
2745                 SvCUR_set(sv, len - 1);
2746                 SvLEN_set(sv, len); /* No longer know the real size. */
2747                 break;
2748             }
2749         }
2750         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2751         SvUTF8_on(sv);
2752     }
2753     return SvCUR(sv);
2754 }
2755
2756 /*
2757 =for apidoc sv_utf8_downgrade
2758
2759 Attempts to convert the PV of an SV from characters to bytes.
2760 If the PV contains a character beyond byte, this conversion will fail;
2761 in this case, either returns false or, if C<fail_ok> is not
2762 true, croaks.
2763
2764 This is not as a general purpose Unicode to byte encoding interface:
2765 use the Encode extension for that.
2766
2767 =cut
2768 */
2769
2770 bool
2771 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
2772 {
2773     if (SvPOKp(sv) && SvUTF8(sv)) {
2774         if (SvCUR(sv)) {
2775             U8 *s;
2776             STRLEN len;
2777
2778             if (SvIsCOW(sv)) {
2779                 sv_force_normal_flags(sv, 0);
2780             }
2781             s = (U8 *) SvPV(sv, len);
2782             if (!utf8_to_bytes(s, &len)) {
2783                 if (fail_ok)
2784                     return FALSE;
2785                 else {
2786                     if (PL_op)
2787                         Perl_croak(aTHX_ "Wide character in %s",
2788                                    OP_DESC(PL_op));
2789                     else
2790                         Perl_croak(aTHX_ "Wide character");
2791                 }
2792             }
2793             SvCUR_set(sv, len);
2794         }
2795     }
2796     SvUTF8_off(sv);
2797     return TRUE;
2798 }
2799
2800 /*
2801 =for apidoc sv_utf8_encode
2802
2803 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
2804 flag off so that it looks like octets again.
2805
2806 =cut
2807 */
2808
2809 void
2810 Perl_sv_utf8_encode(pTHX_ register SV *sv)
2811 {
2812     (void) sv_utf8_upgrade(sv);
2813     if (SvIsCOW(sv)) {
2814         sv_force_normal_flags(sv, 0);
2815     }
2816     if (SvREADONLY(sv)) {
2817         Perl_croak(aTHX_ PL_no_modify);
2818     }
2819     SvUTF8_off(sv);
2820 }
2821
2822 /*
2823 =for apidoc sv_utf8_decode
2824
2825 If the PV of the SV is an octet sequence in UTF-8
2826 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
2827 so that it looks like a character. If the PV contains only single-byte
2828 characters, the C<SvUTF8> flag stays being off.
2829 Scans PV for validity and returns false if the PV is invalid UTF-8.
2830
2831 =cut
2832 */
2833
2834 bool
2835 Perl_sv_utf8_decode(pTHX_ register SV *sv)
2836 {
2837     if (SvPOKp(sv)) {
2838         const U8 *c;
2839         const U8 *e;
2840
2841         /* The octets may have got themselves encoded - get them back as
2842          * bytes
2843          */
2844         if (!sv_utf8_downgrade(sv, TRUE))
2845             return FALSE;
2846
2847         /* it is actually just a matter of turning the utf8 flag on, but
2848          * we want to make sure everything inside is valid utf8 first.
2849          */
2850         c = (const U8 *) SvPVX_const(sv);
2851         if (!is_utf8_string(c, SvCUR(sv)+1))
2852             return FALSE;
2853         e = (const U8 *) SvEND(sv);
2854         while (c < e) {
2855             const U8 ch = *c++;
2856             if (!UTF8_IS_INVARIANT(ch)) {
2857                 SvUTF8_on(sv);
2858                 break;
2859             }
2860         }
2861     }
2862     return TRUE;
2863 }
2864
2865 /*
2866 =for apidoc sv_setsv
2867
2868 Copies the contents of the source SV C<ssv> into the destination SV
2869 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2870 function if the source SV needs to be reused. Does not handle 'set' magic.
2871 Loosely speaking, it performs a copy-by-value, obliterating any previous
2872 content of the destination.
2873
2874 You probably want to use one of the assortment of wrappers, such as
2875 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2876 C<SvSetMagicSV_nosteal>.
2877
2878 =for apidoc sv_setsv_flags
2879
2880 Copies the contents of the source SV C<ssv> into the destination SV
2881 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2882 function if the source SV needs to be reused. Does not handle 'set' magic.
2883 Loosely speaking, it performs a copy-by-value, obliterating any previous
2884 content of the destination.
2885 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
2886 C<ssv> if appropriate, else not. If the C<flags> parameter has the
2887 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
2888 and C<sv_setsv_nomg> are implemented in terms of this function.
2889
2890 You probably want to use one of the assortment of wrappers, such as
2891 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2892 C<SvSetMagicSV_nosteal>.
2893
2894 This is the primary function for copying scalars, and most other
2895 copy-ish functions and macros use this underneath.
2896
2897 =cut
2898 */
2899
2900 void
2901 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
2902 {
2903     register U32 sflags;
2904     register int dtype;
2905     register int stype;
2906
2907     if (sstr == dstr)
2908         return;
2909     SV_CHECK_THINKFIRST_COW_DROP(dstr);
2910     if (!sstr)
2911         sstr = &PL_sv_undef;
2912     stype = SvTYPE(sstr);
2913     dtype = SvTYPE(dstr);
2914
2915     SvAMAGIC_off(dstr);
2916     if ( SvVOK(dstr) )
2917     {
2918         /* need to nuke the magic */
2919         mg_free(dstr);
2920         SvRMAGICAL_off(dstr);
2921     }
2922
2923     /* There's a lot of redundancy below but we're going for speed here */
2924
2925     switch (stype) {
2926     case SVt_NULL:
2927       undef_sstr:
2928         if (dtype != SVt_PVGV) {
2929             (void)SvOK_off(dstr);
2930             return;
2931         }
2932         break;
2933     case SVt_IV:
2934         if (SvIOK(sstr)) {
2935             switch (dtype) {
2936             case SVt_NULL:
2937                 sv_upgrade(dstr, SVt_IV);
2938                 break;
2939             case SVt_NV:
2940                 sv_upgrade(dstr, SVt_PVNV);
2941                 break;
2942             case SVt_RV:
2943             case SVt_PV:
2944                 sv_upgrade(dstr, SVt_PVIV);
2945                 break;
2946             }
2947             (void)SvIOK_only(dstr);
2948             SvIV_set(dstr,  SvIVX(sstr));
2949             if (SvIsUV(sstr))
2950                 SvIsUV_on(dstr);
2951             if (SvTAINTED(sstr))
2952                 SvTAINT(dstr);
2953             return;
2954         }
2955         goto undef_sstr;
2956
2957     case SVt_NV:
2958         if (SvNOK(sstr)) {
2959             switch (dtype) {
2960             case SVt_NULL:
2961             case SVt_IV:
2962                 sv_upgrade(dstr, SVt_NV);
2963                 break;
2964             case SVt_RV:
2965             case SVt_PV:
2966             case SVt_PVIV:
2967                 sv_upgrade(dstr, SVt_PVNV);
2968                 break;
2969             }
2970             SvNV_set(dstr, SvNVX(sstr));
2971             (void)SvNOK_only(dstr);
2972             if (SvTAINTED(sstr))
2973                 SvTAINT(dstr);
2974             return;
2975         }
2976         goto undef_sstr;
2977
2978     case SVt_RV:
2979         if (dtype < SVt_RV)
2980             sv_upgrade(dstr, SVt_RV);
2981         else if (dtype == SVt_PVGV &&
2982                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
2983             sstr = SvRV(sstr);
2984             if (sstr == dstr) {
2985                 if (GvIMPORTED(dstr) != GVf_IMPORTED
2986                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
2987                 {
2988                     GvIMPORTED_on(dstr);
2989                 }
2990                 GvMULTI_on(dstr);
2991                 return;
2992             }
2993             goto glob_assign;
2994         }
2995         break;
2996     case SVt_PVFM:
2997 #ifdef PERL_OLD_COPY_ON_WRITE
2998         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
2999             if (dtype < SVt_PVIV)
3000                 sv_upgrade(dstr, SVt_PVIV);
3001             break;
3002         }
3003         /* Fall through */
3004 #endif
3005     case SVt_PV:
3006         if (dtype < SVt_PV)
3007             sv_upgrade(dstr, SVt_PV);
3008         break;
3009     case SVt_PVIV:
3010         if (dtype < SVt_PVIV)
3011             sv_upgrade(dstr, SVt_PVIV);
3012         break;
3013     case SVt_PVNV:
3014         if (dtype < SVt_PVNV)
3015             sv_upgrade(dstr, SVt_PVNV);
3016         break;
3017     case SVt_PVAV:
3018     case SVt_PVHV:
3019     case SVt_PVCV:
3020     case SVt_PVIO:
3021         {
3022         const char * const type = sv_reftype(sstr,0);
3023         if (PL_op)
3024             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3025         else
3026             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3027         }
3028         break;
3029
3030     case SVt_PVGV:
3031         if (dtype <= SVt_PVGV) {
3032   glob_assign:
3033             if (dtype != SVt_PVGV) {
3034                 const char * const name = GvNAME(sstr);
3035                 const STRLEN len = GvNAMELEN(sstr);
3036                 /* don't upgrade SVt_PVLV: it can hold a glob */
3037                 if (dtype != SVt_PVLV)
3038                     sv_upgrade(dstr, SVt_PVGV);
3039                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3040                 GvSTASH(dstr) = GvSTASH(sstr);
3041                 if (GvSTASH(dstr))
3042                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3043                 GvNAME(dstr) = savepvn(name, len);
3044                 GvNAMELEN(dstr) = len;
3045                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3046             }
3047
3048 #ifdef GV_UNIQUE_CHECK
3049                 if (GvUNIQUE((GV*)dstr)) {
3050                     Perl_croak(aTHX_ PL_no_modify);
3051                 }
3052 #endif
3053
3054             (void)SvOK_off(dstr);
3055             GvINTRO_off(dstr);          /* one-shot flag */
3056             gp_free((GV*)dstr);
3057             GvGP(dstr) = gp_ref(GvGP(sstr));
3058             if (SvTAINTED(sstr))
3059                 SvTAINT(dstr);
3060             if (GvIMPORTED(dstr) != GVf_IMPORTED
3061                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3062             {
3063                 GvIMPORTED_on(dstr);
3064             }
3065             GvMULTI_on(dstr);
3066             return;
3067         }
3068         /* FALL THROUGH */
3069
3070     default:
3071         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3072             mg_get(sstr);
3073             if ((int)SvTYPE(sstr) != stype) {
3074                 stype = SvTYPE(sstr);
3075                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3076                     goto glob_assign;
3077             }
3078         }
3079         if (stype == SVt_PVLV)
3080             SvUPGRADE(dstr, SVt_PVNV);
3081         else
3082             SvUPGRADE(dstr, (U32)stype);
3083     }
3084
3085     sflags = SvFLAGS(sstr);
3086
3087     if (sflags & SVf_ROK) {
3088         if (dtype >= SVt_PV) {
3089             if (dtype == SVt_PVGV) {
3090                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3091                 SV *dref = NULL;
3092                 const int intro = GvINTRO(dstr);
3093
3094 #ifdef GV_UNIQUE_CHECK
3095                 if (GvUNIQUE((GV*)dstr)) {
3096                     Perl_croak(aTHX_ PL_no_modify);
3097                 }
3098 #endif
3099
3100                 if (intro) {
3101                     GvINTRO_off(dstr);  /* one-shot flag */
3102                     GvLINE(dstr) = CopLINE(PL_curcop);
3103                     GvEGV(dstr) = (GV*)dstr;
3104                 }
3105                 GvMULTI_on(dstr);
3106                 switch (SvTYPE(sref)) {
3107                 case SVt_PVAV:
3108                     if (intro)
3109                         SAVEGENERICSV(GvAV(dstr));
3110                     else
3111                         dref = (SV*)GvAV(dstr);
3112                     GvAV(dstr) = (AV*)sref;
3113                     if (!GvIMPORTED_AV(dstr)
3114                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3115                     {
3116                         GvIMPORTED_AV_on(dstr);
3117                     }
3118                     break;
3119                 case SVt_PVHV:
3120                     if (intro)
3121                         SAVEGENERICSV(GvHV(dstr));
3122                     else
3123                         dref = (SV*)GvHV(dstr);
3124                     GvHV(dstr) = (HV*)sref;
3125                     if (!GvIMPORTED_HV(dstr)
3126                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3127                     {
3128                         GvIMPORTED_HV_on(dstr);
3129                     }
3130                     break;
3131                 case SVt_PVCV:
3132                     if (intro) {
3133                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3134                             SvREFCNT_dec(GvCV(dstr));
3135                             GvCV(dstr) = Nullcv;
3136                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3137                             PL_sub_generation++;
3138                         }
3139                         SAVEGENERICSV(GvCV(dstr));
3140                     }
3141                     else
3142                         dref = (SV*)GvCV(dstr);
3143                     if (GvCV(dstr) != (CV*)sref) {
3144                         CV* const cv = GvCV(dstr);
3145                         if (cv) {
3146                             if (!GvCVGEN((GV*)dstr) &&
3147                                 (CvROOT(cv) || CvXSUB(cv)))
3148                             {
3149                                 /* Redefining a sub - warning is mandatory if
3150                                    it was a const and its value changed. */
3151                                 if (CvCONST(cv) && CvCONST((CV*)sref)
3152                                     && cv_const_sv(cv)
3153                                     == cv_const_sv((CV*)sref)) {
3154                                     /* They are 2 constant subroutines
3155                                        generated from the same constant.
3156                                        This probably means that they are
3157                                        really the "same" proxy subroutine
3158                                        instantiated in 2 places. Most likely
3159                                        this is when a constant is exported
3160                                        twice.  Don't warn.  */
3161                                 }
3162                                 else if (ckWARN(WARN_REDEFINE)
3163                                     || (CvCONST(cv)
3164                                         && (!CvCONST((CV*)sref)
3165                                             || sv_cmp(cv_const_sv(cv),
3166                                                       cv_const_sv((CV*)sref)))))
3167                                 {
3168                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3169                                         CvCONST(cv)
3170                                         ? "Constant subroutine %s::%s redefined"
3171                                         : "Subroutine %s::%s redefined",
3172                                         HvNAME_get(GvSTASH((GV*)dstr)),
3173                                         GvENAME((GV*)dstr));
3174                                 }
3175                             }
3176                             if (!intro)
3177                                 cv_ckproto(cv, (GV*)dstr,
3178                                            SvPOK(sref)
3179                                            ? SvPVX_const(sref) : Nullch);
3180                         }
3181                         GvCV(dstr) = (CV*)sref;
3182                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3183                         GvASSUMECV_on(dstr);
3184                         PL_sub_generation++;
3185                     }
3186                     if (!GvIMPORTED_CV(dstr)
3187                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3188                     {
3189                         GvIMPORTED_CV_on(dstr);
3190                     }
3191                     break;
3192                 case SVt_PVIO:
3193                     if (intro)
3194                         SAVEGENERICSV(GvIOp(dstr));
3195                     else
3196                         dref = (SV*)GvIOp(dstr);
3197                     GvIOp(dstr) = (IO*)sref;
3198                     break;
3199                 case SVt_PVFM:
3200                     if (intro)
3201                         SAVEGENERICSV(GvFORM(dstr));
3202                     else
3203                         dref = (SV*)GvFORM(dstr);
3204                     GvFORM(dstr) = (CV*)sref;
3205                     break;
3206                 default:
3207                     if (intro)
3208                         SAVEGENERICSV(GvSV(dstr));
3209                     else
3210                         dref = (SV*)GvSV(dstr);
3211                     GvSV(dstr) = sref;
3212                     if (!GvIMPORTED_SV(dstr)
3213                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3214                     {
3215                         GvIMPORTED_SV_on(dstr);
3216                     }
3217                     break;
3218                 }
3219                 if (dref)
3220                     SvREFCNT_dec(dref);
3221                 if (SvTAINTED(sstr))
3222                     SvTAINT(dstr);
3223                 return;
3224             }
3225             if (SvPVX_const(dstr)) {
3226                 SvPV_free(dstr);
3227                 SvLEN_set(dstr, 0);
3228                 SvCUR_set(dstr, 0);
3229             }
3230         }
3231         (void)SvOK_off(dstr);
3232         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3233         SvROK_on(dstr);
3234         if (sflags & SVp_NOK) {
3235             SvNOKp_on(dstr);
3236             /* Only set the public OK flag if the source has public OK.  */
3237             if (sflags & SVf_NOK)
3238                 SvFLAGS(dstr) |= SVf_NOK;
3239             SvNV_set(dstr, SvNVX(sstr));
3240         }
3241         if (sflags & SVp_IOK) {
3242             (void)SvIOKp_on(dstr);
3243             if (sflags & SVf_IOK)
3244                 SvFLAGS(dstr) |= SVf_IOK;
3245             if (sflags & SVf_IVisUV)
3246                 SvIsUV_on(dstr);
3247             SvIV_set(dstr, SvIVX(sstr));
3248         }
3249         if (SvAMAGIC(sstr)) {
3250             SvAMAGIC_on(dstr);
3251         }
3252     }
3253     else if (sflags & SVp_POK) {
3254         bool isSwipe = 0;
3255
3256         /*
3257          * Check to see if we can just swipe the string.  If so, it's a
3258          * possible small lose on short strings, but a big win on long ones.
3259          * It might even be a win on short strings if SvPVX_const(dstr)
3260          * has to be allocated and SvPVX_const(sstr) has to be freed.
3261          */
3262
3263         /* Whichever path we take through the next code, we want this true,
3264            and doing it now facilitates the COW check.  */
3265         (void)SvPOK_only(dstr);
3266
3267         if (
3268             /* We're not already COW  */
3269             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3270 #ifndef PERL_OLD_COPY_ON_WRITE
3271              /* or we are, but dstr isn't a suitable target.  */
3272              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3273 #endif
3274              )
3275             &&
3276             !(isSwipe =
3277                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3278                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3279                  (!(flags & SV_NOSTEAL)) &&
3280                                         /* and we're allowed to steal temps */
3281                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3282                  SvLEN(sstr)    &&        /* and really is a string */
3283                                 /* and won't be needed again, potentially */
3284               !(PL_op && PL_op->op_type == OP_AASSIGN))
3285 #ifdef PERL_OLD_COPY_ON_WRITE
3286             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3287                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3288                  && SvTYPE(sstr) >= SVt_PVIV)
3289 #endif
3290             ) {
3291             /* Failed the swipe test, and it's not a shared hash key either.
3292                Have to copy the string.  */
3293             STRLEN len = SvCUR(sstr);
3294             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3295             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3296             SvCUR_set(dstr, len);
3297             *SvEND(dstr) = '\0';
3298         } else {
3299             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3300                be true in here.  */
3301             /* Either it's a shared hash key, or it's suitable for
3302                copy-on-write or we can swipe the string.  */
3303             if (DEBUG_C_TEST) {
3304                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3305                 sv_dump(sstr);
3306                 sv_dump(dstr);
3307             }
3308 #ifdef PERL_OLD_COPY_ON_WRITE
3309             if (!isSwipe) {
3310                 /* I believe I should acquire a global SV mutex if
3311                    it's a COW sv (not a shared hash key) to stop
3312                    it going un copy-on-write.
3313                    If the source SV has gone un copy on write between up there
3314                    and down here, then (assert() that) it is of the correct
3315                    form to make it copy on write again */
3316                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3317                     != (SVf_FAKE | SVf_READONLY)) {
3318                     SvREADONLY_on(sstr);
3319                     SvFAKE_on(sstr);
3320                     /* Make the source SV into a loop of 1.
3321                        (about to become 2) */
3322                     SV_COW_NEXT_SV_SET(sstr, sstr);
3323                 }
3324             }
3325 #endif
3326             /* Initial code is common.  */
3327             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3328                 SvPV_free(dstr);
3329             }
3330
3331             if (!isSwipe) {
3332                 /* making another shared SV.  */
3333                 STRLEN cur = SvCUR(sstr);
3334                 STRLEN len = SvLEN(sstr);
3335 #ifdef PERL_OLD_COPY_ON_WRITE
3336                 if (len) {
3337                     assert (SvTYPE(dstr) >= SVt_PVIV);
3338                     /* SvIsCOW_normal */
3339                     /* splice us in between source and next-after-source.  */
3340                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3341                     SV_COW_NEXT_SV_SET(sstr, dstr);
3342                     SvPV_set(dstr, SvPVX_mutable(sstr));
3343                 } else
3344 #endif
3345                 {
3346                     /* SvIsCOW_shared_hash */
3347                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3348                                           "Copy on write: Sharing hash\n"));
3349
3350                     assert (SvTYPE(dstr) >= SVt_PV);
3351                     SvPV_set(dstr,
3352                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3353                 }
3354                 SvLEN_set(dstr, len);
3355                 SvCUR_set(dstr, cur);
3356                 SvREADONLY_on(dstr);
3357                 SvFAKE_on(dstr);
3358                 /* Relesase a global SV mutex.  */
3359             }
3360             else
3361                 {       /* Passes the swipe test.  */
3362                 SvPV_set(dstr, SvPVX_mutable(sstr));
3363                 SvLEN_set(dstr, SvLEN(sstr));
3364                 SvCUR_set(dstr, SvCUR(sstr));
3365
3366                 SvTEMP_off(dstr);
3367                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3368                 SvPV_set(sstr, Nullch);
3369                 SvLEN_set(sstr, 0);
3370                 SvCUR_set(sstr, 0);
3371                 SvTEMP_off(sstr);
3372             }
3373         }
3374         if (sflags & SVf_UTF8)
3375             SvUTF8_on(dstr);
3376         if (sflags & SVp_NOK) {
3377             SvNOKp_on(dstr);
3378             if (sflags & SVf_NOK)
3379                 SvFLAGS(dstr) |= SVf_NOK;
3380             SvNV_set(dstr, SvNVX(sstr));
3381         }
3382         if (sflags & SVp_IOK) {
3383             (void)SvIOKp_on(dstr);
3384             if (sflags & SVf_IOK)
3385                 SvFLAGS(dstr) |= SVf_IOK;
3386             if (sflags & SVf_IVisUV)
3387                 SvIsUV_on(dstr);
3388             SvIV_set(dstr, SvIVX(sstr));
3389         }
3390         if (SvVOK(sstr)) {
3391             const MAGIC * const smg = mg_find(sstr,PERL_MAGIC_vstring);
3392             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3393                         smg->mg_ptr, smg->mg_len);
3394             SvRMAGICAL_on(dstr);
3395         }
3396     }
3397     else if (sflags & SVp_IOK) {
3398         if (sflags & SVf_IOK)
3399             (void)SvIOK_only(dstr);
3400         else {
3401             (void)SvOK_off(dstr);
3402             (void)SvIOKp_on(dstr);
3403         }
3404         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3405         if (sflags & SVf_IVisUV)
3406             SvIsUV_on(dstr);
3407         SvIV_set(dstr, SvIVX(sstr));
3408         if (sflags & SVp_NOK) {
3409             if (sflags & SVf_NOK)
3410                 (void)SvNOK_on(dstr);
3411             else
3412                 (void)SvNOKp_on(dstr);
3413             SvNV_set(dstr, SvNVX(sstr));
3414         }
3415     }
3416     else if (sflags & SVp_NOK) {
3417         if (sflags & SVf_NOK)
3418             (void)SvNOK_only(dstr);
3419         else {
3420             (void)SvOK_off(dstr);
3421             SvNOKp_on(dstr);
3422         }
3423         SvNV_set(dstr, SvNVX(sstr));
3424     }
3425     else {
3426         if (dtype == SVt_PVGV) {
3427             if (ckWARN(WARN_MISC))
3428                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3429         }
3430         else
3431             (void)SvOK_off(dstr);
3432     }
3433     if (SvTAINTED(sstr))
3434         SvTAINT(dstr);
3435 }
3436
3437 /*
3438 =for apidoc sv_setsv_mg
3439
3440 Like C<sv_setsv>, but also handles 'set' magic.
3441
3442 =cut
3443 */
3444
3445 void
3446 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3447 {
3448     sv_setsv(dstr,sstr);
3449     SvSETMAGIC(dstr);
3450 }
3451
3452 #ifdef PERL_OLD_COPY_ON_WRITE
3453 SV *
3454 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3455 {
3456     STRLEN cur = SvCUR(sstr);
3457     STRLEN len = SvLEN(sstr);
3458     register char *new_pv;
3459
3460     if (DEBUG_C_TEST) {
3461         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3462                       sstr, dstr);
3463         sv_dump(sstr);
3464         if (dstr)
3465                     sv_dump(dstr);
3466     }
3467
3468     if (dstr) {
3469         if (SvTHINKFIRST(dstr))
3470             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3471         else if (SvPVX_const(dstr))
3472             Safefree(SvPVX_const(dstr));
3473     }
3474     else
3475         new_SV(dstr);
3476     SvUPGRADE(dstr, SVt_PVIV);
3477
3478     assert (SvPOK(sstr));
3479     assert (SvPOKp(sstr));
3480     assert (!SvIOK(sstr));
3481     assert (!SvIOKp(sstr));
3482     assert (!SvNOK(sstr));
3483     assert (!SvNOKp(sstr));
3484
3485     if (SvIsCOW(sstr)) {
3486
3487         if (SvLEN(sstr) == 0) {
3488             /* source is a COW shared hash key.  */
3489             DEBUG_C(PerlIO_printf(Perl_debug_log,
3490                                   "Fast copy on write: Sharing hash\n"));
3491             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3492             goto common_exit;
3493         }
3494         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3495     } else {
3496         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3497         SvUPGRADE(sstr, SVt_PVIV);
3498         SvREADONLY_on(sstr);
3499         SvFAKE_on(sstr);
3500         DEBUG_C(PerlIO_printf(Perl_debug_log,
3501                               "Fast copy on write: Converting sstr to COW\n"));
3502         SV_COW_NEXT_SV_SET(dstr, sstr);
3503     }
3504     SV_COW_NEXT_SV_SET(sstr, dstr);
3505     new_pv = SvPVX_mutable(sstr);
3506
3507   common_exit:
3508     SvPV_set(dstr, new_pv);
3509     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3510     if (SvUTF8(sstr))
3511         SvUTF8_on(dstr);
3512     SvLEN_set(dstr, len);
3513     SvCUR_set(dstr, cur);
3514     if (DEBUG_C_TEST) {
3515         sv_dump(dstr);
3516     }
3517     return dstr;
3518 }
3519 #endif
3520
3521 /*
3522 =for apidoc sv_setpvn
3523
3524 Copies a string into an SV.  The C<len> parameter indicates the number of
3525 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3526 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3527
3528 =cut
3529 */
3530
3531 void
3532 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3533 {
3534     register char *dptr;
3535
3536     SV_CHECK_THINKFIRST_COW_DROP(sv);
3537     if (!ptr) {
3538         (void)SvOK_off(sv);
3539         return;
3540     }
3541     else {
3542         /* len is STRLEN which is unsigned, need to copy to signed */
3543         const IV iv = len;
3544         if (iv < 0)
3545             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3546     }
3547     SvUPGRADE(sv, SVt_PV);
3548
3549     dptr = SvGROW(sv, len + 1);
3550     Move(ptr,dptr,len,char);
3551     dptr[len] = '\0';
3552     SvCUR_set(sv, len);
3553     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3554     SvTAINT(sv);
3555 }
3556
3557 /*
3558 =for apidoc sv_setpvn_mg
3559
3560 Like C<sv_setpvn>, but also handles 'set' magic.
3561
3562 =cut
3563 */
3564
3565 void
3566 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3567 {
3568     sv_setpvn(sv,ptr,len);
3569     SvSETMAGIC(sv);
3570 }
3571
3572 /*
3573 =for apidoc sv_setpv
3574
3575 Copies a string into an SV.  The string must be null-terminated.  Does not
3576 handle 'set' magic.  See C<sv_setpv_mg>.
3577
3578 =cut
3579 */
3580
3581 void
3582 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3583 {
3584     register STRLEN len;
3585
3586     SV_CHECK_THINKFIRST_COW_DROP(sv);
3587     if (!ptr) {
3588         (void)SvOK_off(sv);
3589         return;
3590     }
3591     len = strlen(ptr);
3592     SvUPGRADE(sv, SVt_PV);
3593
3594     SvGROW(sv, len + 1);
3595     Move(ptr,SvPVX(sv),len+1,char);
3596     SvCUR_set(sv, len);
3597     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3598     SvTAINT(sv);
3599 }
3600
3601 /*
3602 =for apidoc sv_setpv_mg
3603
3604 Like C<sv_setpv>, but also handles 'set' magic.
3605
3606 =cut
3607 */
3608
3609 void
3610 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3611 {
3612     sv_setpv(sv,ptr);
3613     SvSETMAGIC(sv);
3614 }
3615
3616 /*
3617 =for apidoc sv_usepvn
3618
3619 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3620 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3621 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3622 string length, C<len>, must be supplied.  This function will realloc the
3623 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3624 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3625 See C<sv_usepvn_mg>.
3626
3627 =cut
3628 */
3629
3630 void
3631 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3632 {
3633     STRLEN allocate;
3634     SV_CHECK_THINKFIRST_COW_DROP(sv);
3635     SvUPGRADE(sv, SVt_PV);
3636     if (!ptr) {
3637         (void)SvOK_off(sv);
3638         return;
3639     }
3640     if (SvPVX_const(sv))
3641         SvPV_free(sv);
3642
3643     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3644     ptr = saferealloc (ptr, allocate);
3645     SvPV_set(sv, ptr);
3646     SvCUR_set(sv, len);
3647     SvLEN_set(sv, allocate);
3648     *SvEND(sv) = '\0';
3649     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3650     SvTAINT(sv);
3651 }
3652
3653 /*
3654 =for apidoc sv_usepvn_mg
3655
3656 Like C<sv_usepvn>, but also handles 'set' magic.
3657
3658 =cut
3659 */
3660
3661 void
3662 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3663 {
3664     sv_usepvn(sv,ptr,len);
3665     SvSETMAGIC(sv);
3666 }
3667
3668 #ifdef PERL_OLD_COPY_ON_WRITE
3669 /* Need to do this *after* making the SV normal, as we need the buffer
3670    pointer to remain valid until after we've copied it.  If we let go too early,
3671    another thread could invalidate it by unsharing last of the same hash key
3672    (which it can do by means other than releasing copy-on-write Svs)
3673    or by changing the other copy-on-write SVs in the loop.  */
3674 STATIC void
3675 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3676 {
3677     if (len) { /* this SV was SvIsCOW_normal(sv) */
3678          /* we need to find the SV pointing to us.  */
3679         SV * const current = SV_COW_NEXT_SV(after);
3680
3681         if (current == sv) {
3682             /* The SV we point to points back to us (there were only two of us
3683                in the loop.)
3684                Hence other SV is no longer copy on write either.  */
3685             SvFAKE_off(after);
3686             SvREADONLY_off(after);
3687         } else {
3688             /* We need to follow the pointers around the loop.  */
3689             SV *next;
3690             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3691                 assert (next);
3692                 current = next;
3693                  /* don't loop forever if the structure is bust, and we have
3694                     a pointer into a closed loop.  */
3695                 assert (current != after);
3696                 assert (SvPVX_const(current) == pvx);
3697             }
3698             /* Make the SV before us point to the SV after us.  */
3699             SV_COW_NEXT_SV_SET(current, after);
3700         }
3701     } else {
3702         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3703     }
3704 }
3705
3706 int
3707 Perl_sv_release_IVX(pTHX_ register SV *sv)
3708 {
3709     if (SvIsCOW(sv))
3710         sv_force_normal_flags(sv, 0);
3711     SvOOK_off(sv);
3712     return 0;
3713 }
3714 #endif
3715 /*
3716 =for apidoc sv_force_normal_flags
3717
3718 Undo various types of fakery on an SV: if the PV is a shared string, make
3719 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3720 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3721 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3722 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3723 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3724 set to some other value.) In addition, the C<flags> parameter gets passed to
3725 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3726 with flags set to 0.
3727
3728 =cut
3729 */
3730
3731 void
3732 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3733 {
3734 #ifdef PERL_OLD_COPY_ON_WRITE
3735     if (SvREADONLY(sv)) {
3736         /* At this point I believe I should acquire a global SV mutex.  */
3737         if (SvFAKE(sv)) {
3738             const char * const pvx = SvPVX_const(sv);
3739             const STRLEN len = SvLEN(sv);
3740             const STRLEN cur = SvCUR(sv);
3741             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3742             if (DEBUG_C_TEST) {
3743                 PerlIO_printf(Perl_debug_log,
3744                               "Copy on write: Force normal %ld\n",
3745                               (long) flags);
3746                 sv_dump(sv);
3747             }
3748             SvFAKE_off(sv);
3749             SvREADONLY_off(sv);
3750             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3751             SvPV_set(sv, (char*)0);
3752             SvLEN_set(sv, 0);
3753             if (flags & SV_COW_DROP_PV) {
3754                 /* OK, so we don't need to copy our buffer.  */
3755                 SvPOK_off(sv);
3756             } else {
3757                 SvGROW(sv, cur + 1);
3758                 Move(pvx,SvPVX(sv),cur,char);
3759                 SvCUR_set(sv, cur);
3760                 *SvEND(sv) = '\0';
3761             }
3762             sv_release_COW(sv, pvx, len, next);
3763             if (DEBUG_C_TEST) {
3764                 sv_dump(sv);
3765             }
3766         }
3767         else if (IN_PERL_RUNTIME)
3768             Perl_croak(aTHX_ PL_no_modify);
3769         /* At this point I believe that I can drop the global SV mutex.  */
3770     }
3771 #else
3772     if (SvREADONLY(sv)) {
3773         if (SvFAKE(sv)) {
3774             const char * const pvx = SvPVX_const(sv);
3775             const STRLEN len = SvCUR(sv);
3776             SvFAKE_off(sv);
3777             SvREADONLY_off(sv);
3778             SvPV_set(sv, Nullch);
3779             SvLEN_set(sv, 0);
3780             SvGROW(sv, len + 1);
3781             Move(pvx,SvPVX(sv),len,char);
3782             *SvEND(sv) = '\0';
3783             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3784         }
3785         else if (IN_PERL_RUNTIME)
3786             Perl_croak(aTHX_ PL_no_modify);
3787     }
3788 #endif
3789     if (SvROK(sv))
3790         sv_unref_flags(sv, flags);
3791     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
3792         sv_unglob(sv);
3793 }
3794
3795 /*
3796 =for apidoc sv_chop
3797
3798 Efficient removal of characters from the beginning of the string buffer.
3799 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
3800 the string buffer.  The C<ptr> becomes the first character of the adjusted
3801 string. Uses the "OOK hack".
3802 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
3803 refer to the same chunk of data.
3804
3805 =cut
3806 */
3807
3808 void
3809 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
3810 {
3811     register STRLEN delta;
3812     if (!ptr || !SvPOKp(sv))
3813         return;
3814     delta = ptr - SvPVX_const(sv);
3815     SV_CHECK_THINKFIRST(sv);
3816     if (SvTYPE(sv) < SVt_PVIV)
3817         sv_upgrade(sv,SVt_PVIV);
3818
3819     if (!SvOOK(sv)) {
3820         if (!SvLEN(sv)) { /* make copy of shared string */
3821             const char *pvx = SvPVX_const(sv);
3822             const STRLEN len = SvCUR(sv);
3823             SvGROW(sv, len + 1);
3824             Move(pvx,SvPVX(sv),len,char);
3825             *SvEND(sv) = '\0';
3826         }
3827         SvIV_set(sv, 0);
3828         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
3829            and we do that anyway inside the SvNIOK_off
3830         */
3831         SvFLAGS(sv) |= SVf_OOK;
3832     }
3833     SvNIOK_off(sv);
3834     SvLEN_set(sv, SvLEN(sv) - delta);
3835     SvCUR_set(sv, SvCUR(sv) - delta);
3836     SvPV_set(sv, SvPVX(sv) + delta);
3837     SvIV_set(sv, SvIVX(sv) + delta);
3838 }
3839
3840 /*
3841 =for apidoc sv_catpvn
3842
3843 Concatenates the string onto the end of the string which is in the SV.  The
3844 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3845 status set, then the bytes appended should be valid UTF-8.
3846 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
3847
3848 =for apidoc sv_catpvn_flags
3849
3850 Concatenates the string onto the end of the string which is in the SV.  The
3851 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3852 status set, then the bytes appended should be valid UTF-8.
3853 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
3854 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
3855 in terms of this function.
3856
3857 =cut
3858 */
3859
3860 void
3861 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
3862 {
3863     STRLEN dlen;
3864     const char * const dstr = SvPV_force_flags(dsv, dlen, flags);
3865
3866     SvGROW(dsv, dlen + slen + 1);
3867     if (sstr == dstr)
3868         sstr = SvPVX_const(dsv);
3869     Move(sstr, SvPVX(dsv) + dlen, slen, char);
3870     SvCUR_set(dsv, SvCUR(dsv) + slen);
3871     *SvEND(dsv) = '\0';
3872     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
3873     SvTAINT(dsv);
3874     if (flags & SV_SMAGIC)
3875         SvSETMAGIC(dsv);
3876 }
3877
3878 /*
3879 =for apidoc sv_catsv
3880
3881 Concatenates the string from SV C<ssv> onto the end of the string in
3882 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
3883 not 'set' magic.  See C<sv_catsv_mg>.
3884
3885 =for apidoc sv_catsv_flags
3886
3887 Concatenates the string from SV C<ssv> onto the end of the string in
3888 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
3889 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
3890 and C<sv_catsv_nomg> are implemented in terms of this function.
3891
3892 =cut */
3893
3894 void
3895 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
3896 {
3897     if (ssv) {
3898         STRLEN slen;
3899         const char *spv = SvPV_const(ssv, slen);
3900         if (spv) {
3901             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
3902                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
3903                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
3904                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
3905                 dsv->sv_flags doesn't have that bit set.
3906                 Andy Dougherty  12 Oct 2001
3907             */
3908             const I32 sutf8 = DO_UTF8(ssv);
3909             I32 dutf8;
3910
3911             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
3912                 mg_get(dsv);
3913             dutf8 = DO_UTF8(dsv);
3914
3915             if (dutf8 != sutf8) {
3916                 if (dutf8) {
3917                     /* Not modifying source SV, so taking a temporary copy. */
3918                     SV* const csv = sv_2mortal(newSVpvn(spv, slen));
3919
3920                     sv_utf8_upgrade(csv);
3921                     spv = SvPV_const(csv, slen);
3922                 }
3923                 else
3924                     sv_utf8_upgrade_nomg(dsv);
3925             }
3926             sv_catpvn_nomg(dsv, spv, slen);
3927         }
3928     }
3929     if (flags & SV_SMAGIC)
3930         SvSETMAGIC(dsv);
3931 }
3932
3933 /*
3934 =for apidoc sv_catpv
3935
3936 Concatenates the string onto the end of the string which is in the SV.
3937 If the SV has the UTF-8 status set, then the bytes appended should be
3938 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
3939
3940 =cut */
3941
3942 void
3943 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
3944 {
3945     register STRLEN len;
3946     STRLEN tlen;
3947     char *junk;
3948
3949     if (!ptr)
3950         return;
3951     junk = SvPV_force(sv, tlen);
3952     len = strlen(ptr);
3953     SvGROW(sv, tlen + len + 1);
3954     if (ptr == junk)
3955         ptr = SvPVX_const(sv);
3956     Move(ptr,SvPVX(sv)+tlen,len+1,char);
3957     SvCUR_set(sv, SvCUR(sv) + len);
3958     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3959     SvTAINT(sv);
3960 }
3961
3962 /*
3963 =for apidoc sv_catpv_mg
3964
3965 Like C<sv_catpv>, but also handles 'set' magic.
3966
3967 =cut
3968 */
3969
3970 void
3971 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
3972 {
3973     sv_catpv(sv,ptr);
3974     SvSETMAGIC(sv);
3975 }
3976
3977 /*
3978 =for apidoc newSV
3979
3980 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
3981 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
3982 macro.
3983
3984 =cut
3985 */
3986
3987 SV *
3988 Perl_newSV(pTHX_ STRLEN len)
3989 {
3990     register SV *sv;
3991
3992     new_SV(sv);
3993     if (len) {
3994         sv_upgrade(sv, SVt_PV);
3995         SvGROW(sv, len + 1);
3996     }
3997     return sv;
3998 }
3999 /*
4000 =for apidoc sv_magicext
4001
4002 Adds magic to an SV, upgrading it if necessary. Applies the
4003 supplied vtable and returns a pointer to the magic added.
4004
4005 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4006 In particular, you can add magic to SvREADONLY SVs, and add more than
4007 one instance of the same 'how'.
4008
4009 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4010 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4011 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4012 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4013
4014 (This is now used as a subroutine by C<sv_magic>.)
4015
4016 =cut
4017 */
4018 MAGIC * 
4019 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4020                  const char* name, I32 namlen)
4021 {
4022     MAGIC* mg;
4023
4024     if (SvTYPE(sv) < SVt_PVMG) {
4025         SvUPGRADE(sv, SVt_PVMG);
4026     }
4027     Newxz(mg, 1, MAGIC);
4028     mg->mg_moremagic = SvMAGIC(sv);
4029     SvMAGIC_set(sv, mg);
4030
4031     /* Sometimes a magic contains a reference loop, where the sv and
4032        object refer to each other.  To prevent a reference loop that
4033        would prevent such objects being freed, we look for such loops
4034        and if we find one we avoid incrementing the object refcount.
4035
4036        Note we cannot do this to avoid self-tie loops as intervening RV must
4037        have its REFCNT incremented to keep it in existence.
4038
4039     */
4040     if (!obj || obj == sv ||
4041         how == PERL_MAGIC_arylen ||
4042         how == PERL_MAGIC_qr ||
4043         how == PERL_MAGIC_symtab ||
4044         (SvTYPE(obj) == SVt_PVGV &&
4045             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4046             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4047             GvFORM(obj) == (CV*)sv)))
4048     {
4049         mg->mg_obj = obj;
4050     }
4051     else {
4052         mg->mg_obj = SvREFCNT_inc(obj);
4053         mg->mg_flags |= MGf_REFCOUNTED;
4054     }
4055
4056     /* Normal self-ties simply pass a null object, and instead of
4057        using mg_obj directly, use the SvTIED_obj macro to produce a
4058        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4059        with an RV obj pointing to the glob containing the PVIO.  In
4060        this case, to avoid a reference loop, we need to weaken the
4061        reference.
4062     */
4063
4064     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4065         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4066     {
4067       sv_rvweaken(obj);
4068     }
4069
4070     mg->mg_type = how;
4071     mg->mg_len = namlen;
4072     if (name) {
4073         if (namlen > 0)
4074             mg->mg_ptr = savepvn(name, namlen);
4075         else if (namlen == HEf_SVKEY)
4076             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4077         else
4078             mg->mg_ptr = (char *) name;
4079     }
4080     mg->mg_virtual = vtable;
4081
4082     mg_magical(sv);
4083     if (SvGMAGICAL(sv))
4084         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4085     return mg;
4086 }
4087
4088 /*
4089 =for apidoc sv_magic
4090
4091 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4092 then adds a new magic item of type C<how> to the head of the magic list.
4093
4094 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4095 handling of the C<name> and C<namlen> arguments.
4096
4097 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4098 to add more than one instance of the same 'how'.
4099
4100 =cut
4101 */
4102
4103 void
4104 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4105 {
4106     const MGVTBL *vtable;
4107     MAGIC* mg;
4108
4109 #ifdef PERL_OLD_COPY_ON_WRITE
4110     if (SvIsCOW(sv))
4111         sv_force_normal_flags(sv, 0);
4112 #endif
4113     if (SvREADONLY(sv)) {
4114         if (
4115             /* its okay to attach magic to shared strings; the subsequent
4116              * upgrade to PVMG will unshare the string */
4117             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4118
4119             && IN_PERL_RUNTIME
4120             && how != PERL_MAGIC_regex_global
4121             && how != PERL_MAGIC_bm
4122             && how != PERL_MAGIC_fm
4123             && how != PERL_MAGIC_sv
4124             && how != PERL_MAGIC_backref
4125            )
4126         {
4127             Perl_croak(aTHX_ PL_no_modify);
4128         }
4129     }
4130     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4131         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4132             /* sv_magic() refuses to add a magic of the same 'how' as an
4133                existing one
4134              */
4135             if (how == PERL_MAGIC_taint)
4136                 mg->mg_len |= 1;
4137             return;
4138         }
4139     }
4140
4141     switch (how) {
4142     case PERL_MAGIC_sv:
4143         vtable = &PL_vtbl_sv;
4144         break;
4145     case PERL_MAGIC_overload:
4146         vtable = &PL_vtbl_amagic;
4147         break;
4148     case PERL_MAGIC_overload_elem:
4149         vtable = &PL_vtbl_amagicelem;
4150         break;
4151     case PERL_MAGIC_overload_table:
4152         vtable = &PL_vtbl_ovrld;
4153         break;
4154     case PERL_MAGIC_bm:
4155         vtable = &PL_vtbl_bm;
4156         break;
4157     case PERL_MAGIC_regdata:
4158         vtable = &PL_vtbl_regdata;
4159         break;
4160     case PERL_MAGIC_regdatum:
4161         vtable = &PL_vtbl_regdatum;
4162         break;
4163     case PERL_MAGIC_env:
4164         vtable = &PL_vtbl_env;
4165         break;
4166     case PERL_MAGIC_fm:
4167         vtable = &PL_vtbl_fm;
4168         break;
4169     case PERL_MAGIC_envelem:
4170         vtable = &PL_vtbl_envelem;
4171         break;
4172     case PERL_MAGIC_regex_global:
4173         vtable = &PL_vtbl_mglob;
4174         break;
4175     case PERL_MAGIC_isa:
4176         vtable = &PL_vtbl_isa;
4177         break;
4178     case PERL_MAGIC_isaelem:
4179         vtable = &PL_vtbl_isaelem;
4180         break;
4181     case PERL_MAGIC_nkeys:
4182         vtable = &PL_vtbl_nkeys;
4183         break;
4184     case PERL_MAGIC_dbfile:
4185         vtable = NULL;
4186         break;
4187     case PERL_MAGIC_dbline:
4188         vtable = &PL_vtbl_dbline;
4189         break;
4190 #ifdef USE_LOCALE_COLLATE
4191     case PERL_MAGIC_collxfrm:
4192         vtable = &PL_vtbl_collxfrm;
4193         break;
4194 #endif /* USE_LOCALE_COLLATE */
4195     case PERL_MAGIC_tied:
4196         vtable = &PL_vtbl_pack;
4197         break;
4198     case PERL_MAGIC_tiedelem:
4199     case PERL_MAGIC_tiedscalar:
4200         vtable = &PL_vtbl_packelem;
4201         break;
4202     case PERL_MAGIC_qr:
4203         vtable = &PL_vtbl_regexp;
4204         break;
4205     case PERL_MAGIC_sig:
4206         vtable = &PL_vtbl_sig;
4207         break;
4208     case PERL_MAGIC_sigelem:
4209         vtable = &PL_vtbl_sigelem;
4210         break;
4211     case PERL_MAGIC_taint:
4212         vtable = &PL_vtbl_taint;
4213         break;
4214     case PERL_MAGIC_uvar:
4215         vtable = &PL_vtbl_uvar;
4216         break;
4217     case PERL_MAGIC_vec:
4218         vtable = &PL_vtbl_vec;
4219         break;
4220     case PERL_MAGIC_arylen_p:
4221     case PERL_MAGIC_rhash:
4222     case PERL_MAGIC_symtab:
4223     case PERL_MAGIC_vstring:
4224         vtable = NULL;
4225         break;
4226     case PERL_MAGIC_utf8:
4227         vtable = &PL_vtbl_utf8;
4228         break;
4229     case PERL_MAGIC_substr:
4230         vtable = &PL_vtbl_substr;
4231         break;
4232     case PERL_MAGIC_defelem:
4233         vtable = &PL_vtbl_defelem;
4234         break;
4235     case PERL_MAGIC_glob:
4236         vtable = &PL_vtbl_glob;
4237         break;
4238     case PERL_MAGIC_arylen:
4239         vtable = &PL_vtbl_arylen;
4240         break;
4241     case PERL_MAGIC_pos:
4242         vtable = &PL_vtbl_pos;
4243         break;
4244     case PERL_MAGIC_backref:
4245         vtable = &PL_vtbl_backref;
4246         break;
4247     case PERL_MAGIC_ext:
4248         /* Reserved for use by extensions not perl internals.           */
4249         /* Useful for attaching extension internal data to perl vars.   */
4250         /* Note that multiple extensions may clash if magical scalars   */
4251         /* etc holding private data from one are passed to another.     */
4252         vtable = NULL;
4253         break;
4254     default:
4255         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4256     }
4257
4258     /* Rest of work is done else where */
4259     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4260
4261     switch (how) {
4262     case PERL_MAGIC_taint:
4263         mg->mg_len = 1;
4264         break;
4265     case PERL_MAGIC_ext:
4266     case PERL_MAGIC_dbfile:
4267         SvRMAGICAL_on(sv);
4268         break;
4269     }
4270 }
4271
4272 /*
4273 =for apidoc sv_unmagic
4274
4275 Removes all magic of type C<type> from an SV.
4276
4277 =cut
4278 */
4279
4280 int
4281 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4282 {
4283     MAGIC* mg;
4284     MAGIC** mgp;
4285     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4286         return 0;
4287     mgp = &SvMAGIC(sv);
4288     for (mg = *mgp; mg; mg = *mgp) {
4289         if (mg->mg_type == type) {
4290             const MGVTBL* const vtbl = mg->mg_virtual;
4291             *mgp = mg->mg_moremagic;
4292             if (vtbl && vtbl->svt_free)
4293                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4294             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4295                 if (mg->mg_len > 0)
4296                     Safefree(mg->mg_ptr);
4297                 else if (mg->mg_len == HEf_SVKEY)
4298                     SvREFCNT_dec((SV*)mg->mg_ptr);
4299                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4300                     Safefree(mg->mg_ptr);
4301             }
4302             if (mg->mg_flags & MGf_REFCOUNTED)
4303                 SvREFCNT_dec(mg->mg_obj);
4304             Safefree(mg);
4305         }
4306         else
4307             mgp = &mg->mg_moremagic;
4308     }
4309     if (!SvMAGIC(sv)) {
4310         SvMAGICAL_off(sv);
4311         SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4312         SvMAGIC_set(sv, NULL);
4313     }
4314
4315     return 0;
4316 }
4317
4318 /*
4319 =for apidoc sv_rvweaken
4320
4321 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4322 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4323 push a back-reference to this RV onto the array of backreferences
4324 associated with that magic.
4325
4326 =cut
4327 */
4328
4329 SV *
4330 Perl_sv_rvweaken(pTHX_ SV *sv)
4331 {
4332     SV *tsv;
4333     if (!SvOK(sv))  /* let undefs pass */
4334         return sv;
4335     if (!SvROK(sv))
4336         Perl_croak(aTHX_ "Can't weaken a nonreference");
4337     else if (SvWEAKREF(sv)) {
4338         if (ckWARN(WARN_MISC))
4339             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4340         return sv;
4341     }
4342     tsv = SvRV(sv);
4343     Perl_sv_add_backref(aTHX_ tsv, sv);
4344     SvWEAKREF_on(sv);
4345     SvREFCNT_dec(tsv);
4346     return sv;
4347 }
4348
4349 /* Give tsv backref magic if it hasn't already got it, then push a
4350  * back-reference to sv onto the array associated with the backref magic.
4351  */
4352
4353 void
4354 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4355 {
4356     AV *av;
4357
4358     if (SvTYPE(tsv) == SVt_PVHV) {
4359         AV **const avp = Perl_hv_backreferences_p(aTHX_ (HV*)tsv);
4360
4361         av = *avp;
4362         if (!av) {
4363             /* There is no AV in the offical place - try a fixup.  */
4364             MAGIC *const mg = mg_find(tsv, PERL_MAGIC_backref);
4365
4366             if (mg) {
4367                 /* Aha. They've got it stowed in magic.  Bring it back.  */
4368                 av = (AV*)mg->mg_obj;
4369                 /* Stop mg_free decreasing the refernce count.  */
4370                 mg->mg_obj = NULL;
4371                 /* Stop mg_free even calling the destructor, given that
4372                    there's no AV to free up.  */
4373                 mg->mg_virtual = 0;
4374                 sv_unmagic(tsv, PERL_MAGIC_backref);
4375             } else {
4376                 av = newAV();
4377                 AvREAL_off(av);
4378                 SvREFCNT_inc(av);
4379             }
4380             *avp = av;
4381         }
4382     } else {
4383         const MAGIC *const mg
4384             = SvMAGICAL(tsv) ? mg_find(tsv, PERL_MAGIC_backref) : NULL;
4385         if (mg)
4386             av = (AV*)mg->mg_obj;
4387         else {
4388             av = newAV();
4389             AvREAL_off(av);
4390             sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4391             /* av now has a refcnt of 2, which avoids it getting freed
4392              * before us during global cleanup. The extra ref is removed
4393              * by magic_killbackrefs() when tsv is being freed */
4394         }
4395     }
4396     if (AvFILLp(av) >= AvMAX(av)) {
4397         av_extend(av, AvFILLp(av)+1);
4398     }
4399     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4400 }
4401
4402 /* delete a back-reference to ourselves from the backref magic associated
4403  * with the SV we point to.
4404  */
4405
4406 STATIC void
4407 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4408 {
4409     AV *av = NULL;
4410     SV **svp;
4411     I32 i;
4412
4413     if (SvTYPE(tsv) == SVt_PVHV && SvOOK(tsv)) {
4414         av = *Perl_hv_backreferences_p(aTHX_ (HV*)tsv);
4415         /* We mustn't attempt to "fix up" the hash here by moving the
4416            backreference array back to the hv_aux structure, as that is stored
4417            in the main HvARRAY(), and hfreentries assumes that no-one
4418            reallocates HvARRAY() while it is running.  */
4419     }
4420     if (!av) {
4421         const MAGIC *const mg
4422             = SvMAGICAL(tsv) ? mg_find(tsv, PERL_MAGIC_backref) : NULL;
4423         if (mg)
4424             av = (AV *)mg->mg_obj;
4425     }
4426     if (!av) {
4427         if (PL_in_clean_all)
4428             return;
4429         Perl_croak(aTHX_ "panic: del_backref");
4430     }
4431
4432     if (SvIS_FREED(av))
4433         return;
4434
4435     svp = AvARRAY(av);
4436     /* We shouldn't be in here more than once, but for paranoia reasons lets
4437        not assume this.  */
4438     for (i = AvFILLp(av); i >= 0; i--) {
4439         if (svp[i] == sv) {
4440             const SSize_t fill = AvFILLp(av);
4441             if (i != fill) {
4442                 /* We weren't the last entry.
4443                    An unordered list has this property that you can take the
4444                    last element off the end to fill the hole, and it's still
4445                    an unordered list :-)
4446                 */
4447                 svp[i] = svp[fill];
4448             }
4449             svp[fill] = Nullsv;
4450             AvFILLp(av) = fill - 1;
4451         }
4452     }
4453 }
4454
4455 int
4456 Perl_sv_kill_backrefs(pTHX_ SV *sv, AV *av)
4457 {
4458     SV **svp = AvARRAY(av);
4459
4460     PERL_UNUSED_ARG(sv);
4461
4462     /* Not sure why the av can get freed ahead of its sv, but somehow it does
4463        in ext/B/t/bytecode.t test 15 (involving print <DATA>)  */
4464     if (svp && !SvIS_FREED(av)) {
4465         SV *const *const last = svp + AvFILLp(av);
4466
4467         while (svp <= last) {
4468             if (*svp) {
4469                 SV *const referrer = *svp;
4470                 if (SvWEAKREF(referrer)) {
4471                     /* XXX Should we check that it hasn't changed? */
4472                     SvRV_set(referrer, 0);
4473                     SvOK_off(referrer);
4474                     SvWEAKREF_off(referrer);
4475                 } else if (SvTYPE(referrer) == SVt_PVGV ||
4476                            SvTYPE(referrer) == SVt_PVLV) {
4477                     /* You lookin' at me?  */
4478                     assert(GvSTASH(referrer));
4479                     assert(GvSTASH(referrer) == (HV*)sv);
4480                     GvSTASH(referrer) = 0;
4481                 } else {
4482                     Perl_croak(aTHX_
4483                                "panic: magic_killbackrefs (flags=%"UVxf")",
4484                                (UV)SvFLAGS(referrer));
4485                 }
4486
4487                 *svp = Nullsv;
4488             }
4489             svp++;
4490         }
4491     }
4492     SvREFCNT_dec(av); /* remove extra count added by sv_add_backref() */
4493     return 0;
4494 }
4495
4496 /*
4497 =for apidoc sv_insert
4498
4499 Inserts a string at the specified offset/length within the SV. Similar to
4500 the Perl substr() function.
4501
4502 =cut
4503 */
4504
4505 void
4506 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4507 {
4508     register char *big;
4509     register char *mid;
4510     register char *midend;
4511     register char *bigend;
4512     register I32 i;
4513     STRLEN curlen;
4514
4515
4516     if (!bigstr)
4517         Perl_croak(aTHX_ "Can't modify non-existent substring");
4518     SvPV_force(bigstr, curlen);
4519     (void)SvPOK_only_UTF8(bigstr);
4520     if (offset + len > curlen) {
4521         SvGROW(bigstr, offset+len+1);
4522         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4523         SvCUR_set(bigstr, offset+len);
4524     }
4525
4526     SvTAINT(bigstr);
4527     i = littlelen - len;
4528     if (i > 0) {                        /* string might grow */
4529         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4530         mid = big + offset + len;
4531         midend = bigend = big + SvCUR(bigstr);
4532         bigend += i;
4533         *bigend = '\0';
4534         while (midend > mid)            /* shove everything down */
4535             *--bigend = *--midend;
4536         Move(little,big+offset,littlelen,char);
4537         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4538         SvSETMAGIC(bigstr);
4539         return;
4540     }
4541     else if (i == 0) {
4542         Move(little,SvPVX(bigstr)+offset,len,char);
4543         SvSETMAGIC(bigstr);
4544         return;
4545     }
4546
4547     big = SvPVX(bigstr);
4548     mid = big + offset;
4549     midend = mid + len;
4550     bigend = big + SvCUR(bigstr);
4551
4552     if (midend > bigend)
4553         Perl_croak(aTHX_ "panic: sv_insert");
4554
4555     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4556         if (littlelen) {
4557             Move(little, mid, littlelen,char);
4558             mid += littlelen;
4559         }
4560         i = bigend - midend;
4561         if (i > 0) {
4562             Move(midend, mid, i,char);
4563             mid += i;
4564         }
4565         *mid = '\0';
4566         SvCUR_set(bigstr, mid - big);
4567     }
4568     else if ((i = mid - big)) { /* faster from front */
4569         midend -= littlelen;
4570         mid = midend;
4571         sv_chop(bigstr,midend-i);
4572         big += i;
4573         while (i--)
4574             *--midend = *--big;
4575         if (littlelen)
4576             Move(little, mid, littlelen,char);
4577     }
4578     else if (littlelen) {
4579         midend -= littlelen;
4580         sv_chop(bigstr,midend);
4581         Move(little,midend,littlelen,char);
4582     }
4583     else {
4584         sv_chop(bigstr,midend);
4585     }
4586     SvSETMAGIC(bigstr);
4587 }
4588
4589 /*
4590 =for apidoc sv_replace
4591
4592 Make the first argument a copy of the second, then delete the original.
4593 The target SV physically takes over ownership of the body of the source SV
4594 and inherits its flags; however, the target keeps any magic it owns,
4595 and any magic in the source is discarded.
4596 Note that this is a rather specialist SV copying operation; most of the
4597 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4598
4599 =cut
4600 */
4601
4602 void
4603 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4604 {
4605     const U32 refcnt = SvREFCNT(sv);
4606     SV_CHECK_THINKFIRST_COW_DROP(sv);
4607     if (SvREFCNT(nsv) != 1) {
4608         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4609                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4610     }
4611     if (SvMAGICAL(sv)) {
4612         if (SvMAGICAL(nsv))
4613             mg_free(nsv);
4614         else
4615             sv_upgrade(nsv, SVt_PVMG);
4616         SvMAGIC_set(nsv, SvMAGIC(sv));
4617         SvFLAGS(nsv) |= SvMAGICAL(sv);
4618         SvMAGICAL_off(sv);
4619         SvMAGIC_set(sv, NULL);
4620     }
4621     SvREFCNT(sv) = 0;
4622     sv_clear(sv);
4623     assert(!SvREFCNT(sv));
4624 #ifdef DEBUG_LEAKING_SCALARS
4625     sv->sv_flags  = nsv->sv_flags;
4626     sv->sv_any    = nsv->sv_any;
4627     sv->sv_refcnt = nsv->sv_refcnt;
4628     sv->sv_u      = nsv->sv_u;
4629 #else
4630     StructCopy(nsv,sv,SV);
4631 #endif
4632     /* Currently could join these into one piece of pointer arithmetic, but
4633        it would be unclear.  */
4634     if(SvTYPE(sv) == SVt_IV)
4635         SvANY(sv)
4636             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4637     else if (SvTYPE(sv) == SVt_RV) {
4638         SvANY(sv) = &sv->sv_u.svu_rv;
4639     }
4640         
4641
4642 #ifdef PERL_OLD_COPY_ON_WRITE
4643     if (SvIsCOW_normal(nsv)) {
4644         /* We need to follow the pointers around the loop to make the
4645            previous SV point to sv, rather than nsv.  */
4646         SV *next;
4647         SV *current = nsv;
4648         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4649             assert(next);
4650             current = next;
4651             assert(SvPVX_const(current) == SvPVX_const(nsv));
4652         }
4653         /* Make the SV before us point to the SV after us.  */
4654         if (DEBUG_C_TEST) {
4655             PerlIO_printf(Perl_debug_log, "previous is\n");
4656             sv_dump(current);
4657             PerlIO_printf(Perl_debug_log,
4658                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4659                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4660         }
4661         SV_COW_NEXT_SV_SET(current, sv);
4662     }
4663 #endif
4664     SvREFCNT(sv) = refcnt;
4665     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4666     SvREFCNT(nsv) = 0;
4667     del_SV(nsv);
4668 }
4669
4670 /*
4671 =for apidoc sv_clear
4672
4673 Clear an SV: call any destructors, free up any memory used by the body,
4674 and free the body itself. The SV's head is I<not> freed, although
4675 its type is set to all 1's so that it won't inadvertently be assumed
4676 to be live during global destruction etc.
4677 This function should only be called when REFCNT is zero. Most of the time
4678 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4679 instead.
4680
4681 =cut
4682 */
4683
4684 void
4685 Perl_sv_clear(pTHX_ register SV *sv)
4686 {
4687     dVAR;
4688     const U32 type = SvTYPE(sv);
4689     const struct body_details *const sv_type_details
4690         = bodies_by_type + type;
4691
4692     assert(sv);
4693     assert(SvREFCNT(sv) == 0);
4694
4695     if (type <= SVt_IV)
4696         return;
4697
4698     if (SvOBJECT(sv)) {
4699         if (PL_defstash) {              /* Still have a symbol table? */
4700             dSP;
4701             HV* stash;
4702             do {        
4703                 CV* destructor;
4704                 stash = SvSTASH(sv);
4705                 destructor = StashHANDLER(stash,DESTROY);
4706                 if (destructor) {
4707                     SV* const tmpref = newRV(sv);
4708                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4709                     ENTER;
4710                     PUSHSTACKi(PERLSI_DESTROY);
4711                     EXTEND(SP, 2);
4712                     PUSHMARK(SP);
4713                     PUSHs(tmpref);
4714                     PUTBACK;
4715                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4716                 
4717                 
4718                     POPSTACK;
4719                     SPAGAIN;
4720                     LEAVE;
4721                     if(SvREFCNT(tmpref) < 2) {
4722                         /* tmpref is not kept alive! */
4723                         SvREFCNT(sv)--;
4724                         SvRV_set(tmpref, NULL);
4725                         SvROK_off(tmpref);
4726                     }
4727                     SvREFCNT_dec(tmpref);
4728                 }
4729             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4730
4731
4732             if (SvREFCNT(sv)) {
4733                 if (PL_in_clean_objs)
4734                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4735                           HvNAME_get(stash));
4736                 /* DESTROY gave object new lease on life */
4737                 return;
4738             }
4739         }
4740
4741         if (SvOBJECT(sv)) {
4742             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4743             SvOBJECT_off(sv);   /* Curse the object. */
4744             if (type != SVt_PVIO)
4745                 --PL_sv_objcount;       /* XXX Might want something more general */
4746         }
4747     }
4748     if (type >= SVt_PVMG) {
4749         if (SvMAGIC(sv))
4750             mg_free(sv);
4751         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4752             SvREFCNT_dec(SvSTASH(sv));
4753     }
4754     switch (type) {
4755     case SVt_PVIO:
4756         if (IoIFP(sv) &&
4757             IoIFP(sv) != PerlIO_stdin() &&
4758             IoIFP(sv) != PerlIO_stdout() &&
4759             IoIFP(sv) != PerlIO_stderr())
4760         {
4761             io_close((IO*)sv, FALSE);
4762         }
4763         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4764             PerlDir_close(IoDIRP(sv));
4765         IoDIRP(sv) = (DIR*)NULL;
4766         Safefree(IoTOP_NAME(sv));
4767         Safefree(IoFMT_NAME(sv));
4768         Safefree(IoBOTTOM_NAME(sv));
4769         goto freescalar;
4770     case SVt_PVBM:
4771         goto freescalar;
4772     case SVt_PVCV:
4773     case SVt_PVFM:
4774         cv_undef((CV*)sv);
4775         goto freescalar;
4776     case SVt_PVHV:
4777         Perl_hv_kill_backrefs(aTHX_ (HV*)sv);
4778         hv_undef((HV*)sv);
4779         break;
4780     case SVt_PVAV:
4781         av_undef((AV*)sv);
4782         break;
4783     case SVt_PVLV:
4784         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4785             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4786             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4787             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4788         }
4789         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4790             SvREFCNT_dec(LvTARG(sv));
4791         goto freescalar;
4792     case SVt_PVGV:
4793         gp_free((GV*)sv);
4794         Safefree(GvNAME(sv));
4795         /* If we're in a stash, we don't own a reference to it. However it does
4796            have a back reference to us, which needs to be cleared.  */
4797         if (GvSTASH(sv))
4798             sv_del_backref((SV*)GvSTASH(sv), sv);
4799     case SVt_PVMG:
4800     case SVt_PVNV:
4801     case SVt_PVIV:
4802       freescalar:
4803         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4804         if (SvOOK(sv)) {
4805             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4806             /* Don't even bother with turning off the OOK flag.  */
4807         }
4808     case SVt_PV:
4809     case SVt_RV:
4810         if (SvROK(sv)) {
4811             SV *target = SvRV(sv);
4812             if (SvWEAKREF(sv))
4813                 sv_del_backref(target, sv);
4814             else
4815                 SvREFCNT_dec(target);
4816         }
4817 #ifdef PERL_OLD_COPY_ON_WRITE
4818         else if (SvPVX_const(sv)) {
4819             if (SvIsCOW(sv)) {
4820                 /* I believe I need to grab the global SV mutex here and
4821                    then recheck the COW status.  */
4822                 if (DEBUG_C_TEST) {
4823                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4824                     sv_dump(sv);
4825                 }
4826                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4827                                SV_COW_NEXT_SV(sv));
4828                 /* And drop it here.  */
4829                 SvFAKE_off(sv);
4830             } else if (SvLEN(sv)) {
4831                 Safefree(SvPVX_const(sv));
4832             }
4833         }
4834 #else
4835         else if (SvPVX_const(sv) && SvLEN(sv))
4836             Safefree(SvPVX_mutable(sv));
4837         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4838             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4839             SvFAKE_off(sv);
4840         }
4841 #endif
4842         break;
4843     case SVt_NV:
4844         break;
4845     }
4846
4847     SvFLAGS(sv) &= SVf_BREAK;
4848     SvFLAGS(sv) |= SVTYPEMASK;
4849
4850     if (sv_type_details->arena) {
4851         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4852                  &PL_body_roots[type]);
4853     }
4854     else if (sv_type_details->size) {
4855         my_safefree(SvANY(sv));
4856     }
4857 }
4858
4859 /*
4860 =for apidoc sv_newref
4861
4862 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
4863 instead.
4864
4865 =cut
4866 */
4867
4868 SV *
4869 Perl_sv_newref(pTHX_ SV *sv)
4870 {
4871     if (sv)
4872         (SvREFCNT(sv))++;
4873     return sv;
4874 }
4875
4876 /*
4877 =for apidoc sv_free
4878
4879 Decrement an SV's reference count, and if it drops to zero, call
4880 C<sv_clear> to invoke destructors and free up any memory used by
4881 the body; finally, deallocate the SV's head itself.
4882 Normally called via a wrapper macro C<SvREFCNT_dec>.
4883
4884 =cut
4885 */
4886
4887 void
4888 Perl_sv_free(pTHX_ SV *sv)
4889 {
4890     dVAR;
4891     if (!sv)
4892         return;
4893     if (SvREFCNT(sv) == 0) {
4894         if (SvFLAGS(sv) & SVf_BREAK)
4895             /* this SV's refcnt has been artificially decremented to
4896              * trigger cleanup */
4897             return;
4898         if (PL_in_clean_all) /* All is fair */
4899             return;
4900         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4901             /* make sure SvREFCNT(sv)==0 happens very seldom */
4902             SvREFCNT(sv) = (~(U32)0)/2;
4903             return;
4904         }
4905         if (ckWARN_d(WARN_INTERNAL)) {
4906             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
4907                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
4908                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4909 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
4910             Perl_dump_sv_child(aTHX_ sv);
4911 #endif
4912         }
4913         return;
4914     }
4915     if (--(SvREFCNT(sv)) > 0)
4916         return;
4917     Perl_sv_free2(aTHX_ sv);
4918 }
4919
4920 void
4921 Perl_sv_free2(pTHX_ SV *sv)
4922 {
4923     dVAR;
4924 #ifdef DEBUGGING
4925     if (SvTEMP(sv)) {
4926         if (ckWARN_d(WARN_DEBUGGING))
4927             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
4928                         "Attempt to free temp prematurely: SV 0x%"UVxf
4929                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4930         return;
4931     }
4932 #endif
4933     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4934         /* make sure SvREFCNT(sv)==0 happens very seldom */
4935         SvREFCNT(sv) = (~(U32)0)/2;
4936         return;
4937     }
4938     sv_clear(sv);
4939     if (! SvREFCNT(sv))
4940         del_SV(sv);
4941 }
4942
4943 /*
4944 =for apidoc sv_len
4945
4946 Returns the length of the string in the SV. Handles magic and type
4947 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
4948
4949 =cut
4950 */
4951
4952 STRLEN
4953 Perl_sv_len(pTHX_ register SV *sv)
4954 {
4955     STRLEN len;
4956
4957     if (!sv)
4958         return 0;
4959
4960     if (SvGMAGICAL(sv))
4961         len = mg_length(sv);
4962     else
4963         (void)SvPV_const(sv, len);
4964     return len;
4965 }
4966
4967 /*
4968 =for apidoc sv_len_utf8
4969
4970 Returns the number of characters in the string in an SV, counting wide
4971 UTF-8 bytes as a single character. Handles magic and type coercion.
4972
4973 =cut
4974 */
4975
4976 /*
4977  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
4978  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
4979  * (Note that the mg_len is not the length of the mg_ptr field.)
4980  *
4981  */
4982
4983 STRLEN
4984 Perl_sv_len_utf8(pTHX_ register SV *sv)
4985 {
4986     if (!sv)
4987         return 0;
4988
4989     if (SvGMAGICAL(sv))
4990         return mg_length(sv);
4991     else
4992     {
4993         STRLEN len, ulen;
4994         const U8 *s = (U8*)SvPV_const(sv, len);
4995         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
4996
4997         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
4998             ulen = mg->mg_len;
4999 #ifdef PERL_UTF8_CACHE_ASSERT
5000             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
5001 #endif
5002         }
5003         else {
5004             ulen = Perl_utf8_length(aTHX_ s, s + len);
5005             if (!mg && !SvREADONLY(sv)) {
5006                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5007                 mg = mg_find(sv, PERL_MAGIC_utf8);
5008                 assert(mg);
5009             }
5010             if (mg)
5011                 mg->mg_len = ulen;
5012         }
5013         return ulen;
5014     }
5015 }
5016
5017 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
5018  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5019  * between UTF-8 and byte offsets.  There are two (substr offset and substr
5020  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
5021  * and byte offset) cache positions.
5022  *
5023  * The mg_len field is used by sv_len_utf8(), see its comments.
5024  * Note that the mg_len is not the length of the mg_ptr field.
5025  *
5026  */
5027 STATIC bool
5028 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
5029                    I32 offsetp, const U8 *s, const U8 *start)
5030 {
5031     bool found = FALSE;
5032
5033     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5034         if (!*mgp)
5035             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
5036         assert(*mgp);
5037
5038         if ((*mgp)->mg_ptr)
5039             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5040         else {
5041             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5042             (*mgp)->mg_ptr = (char *) *cachep;
5043         }
5044         assert(*cachep);
5045
5046         (*cachep)[i]   = offsetp;
5047         (*cachep)[i+1] = s - start;
5048         found = TRUE;
5049     }
5050
5051     return found;
5052 }
5053
5054 /*
5055  * S_utf8_mg_pos() is used to query and update mg_ptr field of
5056  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
5057  * between UTF-8 and byte offsets.  See also the comments of
5058  * S_utf8_mg_pos_init().
5059  *
5060  */
5061 STATIC bool
5062 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
5063 {
5064     bool found = FALSE;
5065
5066     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5067         if (!*mgp)
5068             *mgp = mg_find(sv, PERL_MAGIC_utf8);
5069         if (*mgp && (*mgp)->mg_ptr) {
5070             *cachep = (STRLEN *) (*mgp)->mg_ptr;
5071             ASSERT_UTF8_CACHE(*cachep);
5072             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
5073                  found = TRUE;
5074             else {                      /* We will skip to the right spot. */
5075                  STRLEN forw  = 0;
5076                  STRLEN backw = 0;
5077                  const U8* p = NULL;
5078
5079                  /* The assumption is that going backward is half
5080                   * the speed of going forward (that's where the
5081                   * 2 * backw in the below comes from).  (The real
5082                   * figure of course depends on the UTF-8 data.) */
5083
5084                  if ((*cachep)[i] > (STRLEN)uoff) {
5085                       forw  = uoff;
5086                       backw = (*cachep)[i] - (STRLEN)uoff;
5087
5088                       if (forw < 2 * backw)
5089                            p = start;
5090                       else
5091                            p = start + (*cachep)[i+1];
5092                  }
5093                  /* Try this only for the substr offset (i == 0),
5094                   * not for the substr length (i == 2). */
5095                  else if (i == 0) { /* (*cachep)[i] < uoff */
5096                       const STRLEN ulen = sv_len_utf8(sv);
5097
5098                       if ((STRLEN)uoff < ulen) {
5099                            forw  = (STRLEN)uoff - (*cachep)[i];
5100                            backw = ulen - (STRLEN)uoff;
5101
5102                            if (forw < 2 * backw)
5103                                 p = start + (*cachep)[i+1];
5104                            else
5105                                 p = send;
5106                       }
5107
5108                       /* If the string is not long enough for uoff,
5109                        * we could extend it, but not at this low a level. */
5110                  }
5111
5112                  if (p) {
5113                       if (forw < 2 * backw) {
5114                            while (forw--)
5115                                 p += UTF8SKIP(p);
5116                       }
5117                       else {
5118                            while (backw--) {
5119                                 p--;
5120                                 while (UTF8_IS_CONTINUATION(*p))
5121                                      p--;
5122                            }
5123                       }
5124
5125                       /* Update the cache. */
5126                       (*cachep)[i]   = (STRLEN)uoff;
5127                       (*cachep)[i+1] = p - start;
5128
5129                       /* Drop the stale "length" cache */
5130                       if (i == 0) {
5131                           (*cachep)[2] = 0;
5132                           (*cachep)[3] = 0;
5133                       }
5134
5135                       found = TRUE;
5136                  }
5137             }
5138             if (found) {        /* Setup the return values. */
5139                  *offsetp = (*cachep)[i+1];
5140                  *sp = start + *offsetp;
5141                  if (*sp >= send) {
5142                       *sp = send;
5143                       *offsetp = send - start;
5144                  }
5145                  else if (*sp < start) {
5146                       *sp = start;
5147                       *offsetp = 0;
5148                  }
5149             }
5150         }
5151 #ifdef PERL_UTF8_CACHE_ASSERT
5152         if (found) {
5153              U8 *s = start;
5154              I32 n = uoff;
5155
5156              while (n-- && s < send)
5157                   s += UTF8SKIP(s);
5158
5159              if (i == 0) {
5160                   assert(*offsetp == s - start);
5161                   assert((*cachep)[0] == (STRLEN)uoff);
5162                   assert((*cachep)[1] == *offsetp);
5163              }
5164              ASSERT_UTF8_CACHE(*cachep);
5165         }
5166 #endif
5167     }
5168
5169     return found;
5170 }
5171
5172 /*
5173 =for apidoc sv_pos_u2b
5174
5175 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5176 the start of the string, to a count of the equivalent number of bytes; if
5177 lenp is non-zero, it does the same to lenp, but this time starting from
5178 the offset, rather than from the start of the string. Handles magic and
5179 type coercion.
5180
5181 =cut
5182 */
5183
5184 /*
5185  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5186  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5187  * byte offsets.  See also the comments of S_utf8_mg_pos().
5188  *
5189  */
5190
5191 void
5192 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5193 {
5194     const U8 *start;
5195     STRLEN len;
5196
5197     if (!sv)
5198         return;
5199
5200     start = (U8*)SvPV_const(sv, len);
5201     if (len) {
5202         STRLEN boffset = 0;
5203         STRLEN *cache = NULL;
5204         const U8 *s = start;
5205         I32 uoffset = *offsetp;
5206         const U8 * const send = s + len;
5207         MAGIC *mg = NULL;
5208         bool found = utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send);
5209
5210          if (!found && uoffset > 0) {
5211               while (s < send && uoffset--)
5212                    s += UTF8SKIP(s);
5213               if (s >= send)
5214                    s = send;
5215               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5216                   boffset = cache[1];
5217               *offsetp = s - start;
5218          }
5219          if (lenp) {
5220               found = FALSE;
5221               start = s;
5222               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5223                   *lenp -= boffset;
5224                   found = TRUE;
5225               }
5226               if (!found && *lenp > 0) {
5227                    I32 ulen = *lenp;
5228                    if (ulen > 0)
5229                         while (s < send && ulen--)
5230                              s += UTF8SKIP(s);
5231                    if (s >= send)
5232                         s = send;
5233                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5234               }
5235               *lenp = s - start;
5236          }
5237          ASSERT_UTF8_CACHE(cache);
5238     }
5239     else {
5240          *offsetp = 0;
5241          if (lenp)
5242               *lenp = 0;
5243     }
5244
5245     return;
5246 }
5247
5248 /*
5249 =for apidoc sv_pos_b2u
5250
5251 Converts the value pointed to by offsetp from a count of bytes from the
5252 start of the string, to a count of the equivalent number of UTF-8 chars.
5253 Handles magic and type coercion.
5254
5255 =cut
5256 */
5257
5258 /*
5259  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5260  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5261  * byte offsets.  See also the comments of S_utf8_mg_pos().
5262  *
5263  */
5264
5265 void
5266 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5267 {
5268     const U8* s;
5269     STRLEN len;
5270
5271     if (!sv)
5272         return;
5273
5274     s = (const U8*)SvPV_const(sv, len);
5275     if ((I32)len < *offsetp)
5276         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5277     else {
5278         const U8* send = s + *offsetp;
5279         MAGIC* mg = NULL;
5280         STRLEN *cache = NULL;
5281
5282         len = 0;
5283
5284         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5285             mg = mg_find(sv, PERL_MAGIC_utf8);
5286             if (mg && mg->mg_ptr) {
5287                 cache = (STRLEN *) mg->mg_ptr;
5288                 if (cache[1] == (STRLEN)*offsetp) {
5289                     /* An exact match. */
5290                     *offsetp = cache[0];
5291
5292                     return;
5293                 }
5294                 else if (cache[1] < (STRLEN)*offsetp) {
5295                     /* We already know part of the way. */
5296                     len = cache[0];
5297                     s  += cache[1];
5298                     /* Let the below loop do the rest. */
5299                 }
5300                 else { /* cache[1] > *offsetp */
5301                     /* We already know all of the way, now we may
5302                      * be able to walk back.  The same assumption
5303                      * is made as in S_utf8_mg_pos(), namely that
5304                      * walking backward is twice slower than
5305                      * walking forward. */
5306                     const STRLEN forw  = *offsetp;
5307                     STRLEN backw = cache[1] - *offsetp;
5308
5309                     if (!(forw < 2 * backw)) {
5310                         const U8 *p = s + cache[1];
5311                         STRLEN ubackw = 0;
5312                         
5313                         cache[1] -= backw;
5314
5315                         while (backw--) {
5316                             p--;
5317                             while (UTF8_IS_CONTINUATION(*p)) {
5318                                 p--;
5319                                 backw--;
5320                             }
5321                             ubackw++;
5322                         }
5323
5324                         cache[0] -= ubackw;
5325                         *offsetp = cache[0];
5326
5327                         /* Drop the stale "length" cache */
5328                         cache[2] = 0;
5329                         cache[3] = 0;
5330
5331                         return;
5332                     }
5333                 }
5334             }
5335             ASSERT_UTF8_CACHE(cache);
5336         }
5337
5338         while (s < send) {
5339             STRLEN n = 1;
5340
5341             /* Call utf8n_to_uvchr() to validate the sequence
5342              * (unless a simple non-UTF character) */
5343             if (!UTF8_IS_INVARIANT(*s))
5344                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5345             if (n > 0) {
5346                 s += n;
5347                 len++;
5348             }
5349             else
5350                 break;
5351         }
5352
5353         if (!SvREADONLY(sv)) {
5354             if (!mg) {
5355                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5356                 mg = mg_find(sv, PERL_MAGIC_utf8);
5357             }
5358             assert(mg);
5359
5360             if (!mg->mg_ptr) {
5361                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5362                 mg->mg_ptr = (char *) cache;
5363             }
5364             assert(cache);
5365
5366             cache[0] = len;
5367             cache[1] = *offsetp;
5368             /* Drop the stale "length" cache */
5369             cache[2] = 0;
5370             cache[3] = 0;
5371         }
5372
5373         *offsetp = len;
5374     }
5375     return;
5376 }
5377
5378 /*
5379 =for apidoc sv_eq
5380
5381 Returns a boolean indicating whether the strings in the two SVs are
5382 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5383 coerce its args to strings if necessary.
5384
5385 =cut
5386 */
5387
5388 I32
5389 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5390 {
5391     const char *pv1;
5392     STRLEN cur1;
5393     const char *pv2;
5394     STRLEN cur2;
5395     I32  eq     = 0;
5396     char *tpv   = Nullch;
5397     SV* svrecode = Nullsv;
5398
5399     if (!sv1) {
5400         pv1 = "";
5401         cur1 = 0;
5402     }
5403     else
5404         pv1 = SvPV_const(sv1, cur1);
5405
5406     if (!sv2){
5407         pv2 = "";
5408         cur2 = 0;
5409     }
5410     else
5411         pv2 = SvPV_const(sv2, cur2);
5412
5413     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5414         /* Differing utf8ness.
5415          * Do not UTF8size the comparands as a side-effect. */
5416          if (PL_encoding) {
5417               if (SvUTF8(sv1)) {
5418                    svrecode = newSVpvn(pv2, cur2);
5419                    sv_recode_to_utf8(svrecode, PL_encoding);
5420                    pv2 = SvPV_const(svrecode, cur2);
5421               }
5422               else {
5423                    svrecode = newSVpvn(pv1, cur1);
5424                    sv_recode_to_utf8(svrecode, PL_encoding);
5425                    pv1 = SvPV_const(svrecode, cur1);
5426               }
5427               /* Now both are in UTF-8. */
5428               if (cur1 != cur2) {
5429                    SvREFCNT_dec(svrecode);
5430                    return FALSE;
5431               }
5432          }
5433          else {
5434               bool is_utf8 = TRUE;
5435
5436               if (SvUTF8(sv1)) {
5437                    /* sv1 is the UTF-8 one,
5438                     * if is equal it must be downgrade-able */
5439                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5440                                                      &cur1, &is_utf8);
5441                    if (pv != pv1)
5442                         pv1 = tpv = pv;
5443               }
5444               else {
5445                    /* sv2 is the UTF-8 one,
5446                     * if is equal it must be downgrade-able */
5447                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5448                                                       &cur2, &is_utf8);
5449                    if (pv != pv2)
5450                         pv2 = tpv = pv;
5451               }
5452               if (is_utf8) {
5453                    /* Downgrade not possible - cannot be eq */
5454                    assert (tpv == 0);
5455                    return FALSE;
5456               }
5457          }
5458     }
5459
5460     if (cur1 == cur2)
5461         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5462         
5463     if (svrecode)
5464          SvREFCNT_dec(svrecode);
5465
5466     if (tpv)
5467         Safefree(tpv);
5468
5469     return eq;
5470 }
5471
5472 /*
5473 =for apidoc sv_cmp
5474
5475 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5476 string in C<sv1> is less than, equal to, or greater than the string in
5477 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5478 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5479
5480 =cut
5481 */
5482
5483 I32
5484 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5485 {
5486     STRLEN cur1, cur2;
5487     const char *pv1, *pv2;
5488     char *tpv = Nullch;
5489     I32  cmp;
5490     SV *svrecode = Nullsv;
5491
5492     if (!sv1) {
5493         pv1 = "";
5494         cur1 = 0;
5495     }
5496     else
5497         pv1 = SvPV_const(sv1, cur1);
5498
5499     if (!sv2) {
5500         pv2 = "";
5501         cur2 = 0;
5502     }
5503     else
5504         pv2 = SvPV_const(sv2, cur2);
5505
5506     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5507         /* Differing utf8ness.
5508          * Do not UTF8size the comparands as a side-effect. */
5509         if (SvUTF8(sv1)) {
5510             if (PL_encoding) {
5511                  svrecode = newSVpvn(pv2, cur2);
5512                  sv_recode_to_utf8(svrecode, PL_encoding);
5513                  pv2 = SvPV_const(svrecode, cur2);
5514             }
5515             else {
5516                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5517             }
5518         }
5519         else {
5520             if (PL_encoding) {
5521                  svrecode = newSVpvn(pv1, cur1);
5522                  sv_recode_to_utf8(svrecode, PL_encoding);
5523                  pv1 = SvPV_const(svrecode, cur1);
5524             }
5525             else {
5526                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5527             }
5528         }
5529     }
5530
5531     if (!cur1) {
5532         cmp = cur2 ? -1 : 0;
5533     } else if (!cur2) {
5534         cmp = 1;
5535     } else {
5536         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5537
5538         if (retval) {
5539             cmp = retval < 0 ? -1 : 1;
5540         } else if (cur1 == cur2) {
5541             cmp = 0;
5542         } else {
5543             cmp = cur1 < cur2 ? -1 : 1;
5544         }
5545     }
5546
5547     if (svrecode)
5548          SvREFCNT_dec(svrecode);
5549
5550     if (tpv)
5551         Safefree(tpv);
5552
5553     return cmp;
5554 }
5555
5556 /*
5557 =for apidoc sv_cmp_locale
5558
5559 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5560 'use bytes' aware, handles get magic, and will coerce its args to strings
5561 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5562
5563 =cut
5564 */
5565
5566 I32
5567 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5568 {
5569 #ifdef USE_LOCALE_COLLATE
5570
5571     char *pv1, *pv2;
5572     STRLEN len1, len2;
5573     I32 retval;
5574
5575     if (PL_collation_standard)
5576         goto raw_compare;
5577
5578     len1 = 0;
5579     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5580     len2 = 0;
5581     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5582
5583     if (!pv1 || !len1) {
5584         if (pv2 && len2)
5585             return -1;
5586         else
5587             goto raw_compare;
5588     }
5589     else {
5590         if (!pv2 || !len2)
5591             return 1;
5592     }
5593
5594     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5595
5596     if (retval)
5597         return retval < 0 ? -1 : 1;
5598
5599     /*
5600      * When the result of collation is equality, that doesn't mean
5601      * that there are no differences -- some locales exclude some
5602      * characters from consideration.  So to avoid false equalities,
5603      * we use the raw string as a tiebreaker.
5604      */
5605
5606   raw_compare:
5607     /* FALL THROUGH */
5608
5609 #endif /* USE_LOCALE_COLLATE */
5610
5611     return sv_cmp(sv1, sv2);
5612 }
5613
5614
5615 #ifdef USE_LOCALE_COLLATE
5616
5617 /*
5618 =for apidoc sv_collxfrm
5619
5620 Add Collate Transform magic to an SV if it doesn't already have it.
5621
5622 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5623 scalar data of the variable, but transformed to such a format that a normal
5624 memory comparison can be used to compare the data according to the locale
5625 settings.
5626
5627 =cut
5628 */
5629
5630 char *
5631 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5632 {
5633     MAGIC *mg;
5634
5635     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5636     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5637         const char *s;
5638         char *xf;
5639         STRLEN len, xlen;
5640
5641         if (mg)
5642             Safefree(mg->mg_ptr);
5643         s = SvPV_const(sv, len);
5644         if ((xf = mem_collxfrm(s, len, &xlen))) {
5645             if (SvREADONLY(sv)) {
5646                 SAVEFREEPV(xf);
5647                 *nxp = xlen;
5648                 return xf + sizeof(PL_collation_ix);
5649             }
5650             if (! mg) {
5651                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5652                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5653                 assert(mg);
5654             }
5655             mg->mg_ptr = xf;
5656             mg->mg_len = xlen;
5657         }
5658         else {
5659             if (mg) {
5660                 mg->mg_ptr = NULL;
5661                 mg->mg_len = -1;
5662             }
5663         }
5664     }
5665     if (mg && mg->mg_ptr) {
5666         *nxp = mg->mg_len;
5667         return mg->mg_ptr + sizeof(PL_collation_ix);
5668     }
5669     else {
5670         *nxp = 0;
5671         return NULL;
5672     }
5673 }
5674
5675 #endif /* USE_LOCALE_COLLATE */
5676
5677 /*
5678 =for apidoc sv_gets
5679
5680 Get a line from the filehandle and store it into the SV, optionally
5681 appending to the currently-stored string.
5682
5683 =cut
5684 */
5685
5686 char *
5687 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5688 {
5689     const char *rsptr;
5690     STRLEN rslen;
5691     register STDCHAR rslast;
5692     register STDCHAR *bp;
5693     register I32 cnt;
5694     I32 i = 0;
5695     I32 rspara = 0;
5696     I32 recsize;
5697
5698     if (SvTHINKFIRST(sv))
5699         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5700     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5701        from <>.
5702        However, perlbench says it's slower, because the existing swipe code
5703        is faster than copy on write.
5704        Swings and roundabouts.  */
5705     SvUPGRADE(sv, SVt_PV);
5706
5707     SvSCREAM_off(sv);
5708
5709     if (append) {
5710         if (PerlIO_isutf8(fp)) {
5711             if (!SvUTF8(sv)) {
5712                 sv_utf8_upgrade_nomg(sv);
5713                 sv_pos_u2b(sv,&append,0);
5714             }
5715         } else if (SvUTF8(sv)) {
5716             SV * const tsv = NEWSV(0,0);
5717             sv_gets(tsv, fp, 0);
5718             sv_utf8_upgrade_nomg(tsv);
5719             SvCUR_set(sv,append);
5720             sv_catsv(sv,tsv);
5721             sv_free(tsv);
5722             goto return_string_or_null;
5723         }
5724     }
5725
5726     SvPOK_only(sv);
5727     if (PerlIO_isutf8(fp))
5728         SvUTF8_on(sv);
5729
5730     if (IN_PERL_COMPILETIME) {
5731         /* we always read code in line mode */
5732         rsptr = "\n";
5733         rslen = 1;
5734     }
5735     else if (RsSNARF(PL_rs)) {
5736         /* If it is a regular disk file use size from stat() as estimate
5737            of amount we are going to read - may result in malloc-ing
5738            more memory than we realy need if layers bellow reduce
5739            size we read (e.g. CRLF or a gzip layer)
5740          */
5741         Stat_t st;
5742         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5743             const Off_t offset = PerlIO_tell(fp);
5744             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5745                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5746             }
5747         }
5748         rsptr = NULL;
5749         rslen = 0;
5750     }
5751     else if (RsRECORD(PL_rs)) {
5752       I32 bytesread;
5753       char *buffer;
5754
5755       /* Grab the size of the record we're getting */
5756       recsize = SvIV(SvRV(PL_rs));
5757       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5758       /* Go yank in */
5759 #ifdef VMS
5760       /* VMS wants read instead of fread, because fread doesn't respect */
5761       /* RMS record boundaries. This is not necessarily a good thing to be */
5762       /* doing, but we've got no other real choice - except avoid stdio
5763          as implementation - perhaps write a :vms layer ?
5764        */
5765       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5766 #else
5767       bytesread = PerlIO_read(fp, buffer, recsize);
5768 #endif
5769       if (bytesread < 0)
5770           bytesread = 0;
5771       SvCUR_set(sv, bytesread += append);
5772       buffer[bytesread] = '\0';
5773       goto return_string_or_null;
5774     }
5775     else if (RsPARA(PL_rs)) {
5776         rsptr = "\n\n";
5777         rslen = 2;
5778         rspara = 1;
5779     }
5780     else {
5781         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5782         if (PerlIO_isutf8(fp)) {
5783             rsptr = SvPVutf8(PL_rs, rslen);
5784         }
5785         else {
5786             if (SvUTF8(PL_rs)) {
5787                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5788                     Perl_croak(aTHX_ "Wide character in $/");
5789                 }
5790             }
5791             rsptr = SvPV_const(PL_rs, rslen);
5792         }
5793     }
5794
5795     rslast = rslen ? rsptr[rslen - 1] : '\0';
5796
5797     if (rspara) {               /* have to do this both before and after */
5798         do {                    /* to make sure file boundaries work right */
5799             if (PerlIO_eof(fp))
5800                 return 0;
5801             i = PerlIO_getc(fp);
5802             if (i != '\n') {
5803                 if (i == -1)
5804                     return 0;
5805                 PerlIO_ungetc(fp,i);
5806                 break;
5807             }
5808         } while (i != EOF);
5809     }
5810
5811     /* See if we know enough about I/O mechanism to cheat it ! */
5812
5813     /* This used to be #ifdef test - it is made run-time test for ease
5814        of abstracting out stdio interface. One call should be cheap
5815        enough here - and may even be a macro allowing compile
5816        time optimization.
5817      */
5818
5819     if (PerlIO_fast_gets(fp)) {
5820
5821     /*
5822      * We're going to steal some values from the stdio struct
5823      * and put EVERYTHING in the innermost loop into registers.
5824      */
5825     register STDCHAR *ptr;
5826     STRLEN bpx;
5827     I32 shortbuffered;
5828
5829 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5830     /* An ungetc()d char is handled separately from the regular
5831      * buffer, so we getc() it back out and stuff it in the buffer.
5832      */
5833     i = PerlIO_getc(fp);
5834     if (i == EOF) return 0;
5835     *(--((*fp)->_ptr)) = (unsigned char) i;
5836     (*fp)->_cnt++;
5837 #endif
5838
5839     /* Here is some breathtakingly efficient cheating */
5840
5841     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5842     /* make sure we have the room */
5843     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5844         /* Not room for all of it
5845            if we are looking for a separator and room for some
5846          */
5847         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5848             /* just process what we have room for */
5849             shortbuffered = cnt - SvLEN(sv) + append + 1;
5850             cnt -= shortbuffered;
5851         }
5852         else {
5853             shortbuffered = 0;
5854             /* remember that cnt can be negative */
5855             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5856         }
5857     }
5858     else
5859         shortbuffered = 0;
5860     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
5861     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
5862     DEBUG_P(PerlIO_printf(Perl_debug_log,
5863         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5864     DEBUG_P(PerlIO_printf(Perl_debug_log,
5865         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5866                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5867                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
5868     for (;;) {
5869       screamer:
5870         if (cnt > 0) {
5871             if (rslen) {
5872                 while (cnt > 0) {                    /* this     |  eat */
5873                     cnt--;
5874                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
5875                         goto thats_all_folks;        /* screams  |  sed :-) */
5876                 }
5877             }
5878             else {
5879                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
5880                 bp += cnt;                           /* screams  |  dust */
5881                 ptr += cnt;                          /* louder   |  sed :-) */
5882                 cnt = 0;
5883             }
5884         }
5885         
5886         if (shortbuffered) {            /* oh well, must extend */
5887             cnt = shortbuffered;
5888             shortbuffered = 0;
5889             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
5890             SvCUR_set(sv, bpx);
5891             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
5892             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
5893             continue;
5894         }
5895
5896         DEBUG_P(PerlIO_printf(Perl_debug_log,
5897                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
5898                               PTR2UV(ptr),(long)cnt));
5899         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
5900 #if 0
5901         DEBUG_P(PerlIO_printf(Perl_debug_log,
5902             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5903             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5904             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5905 #endif
5906         /* This used to call 'filbuf' in stdio form, but as that behaves like
5907            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
5908            another abstraction.  */
5909         i   = PerlIO_getc(fp);          /* get more characters */
5910 #if 0
5911         DEBUG_P(PerlIO_printf(Perl_debug_log,
5912             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5913             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5914             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5915 #endif
5916         cnt = PerlIO_get_cnt(fp);
5917         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
5918         DEBUG_P(PerlIO_printf(Perl_debug_log,
5919             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5920
5921         if (i == EOF)                   /* all done for ever? */
5922             goto thats_really_all_folks;
5923
5924         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
5925         SvCUR_set(sv, bpx);
5926         SvGROW(sv, bpx + cnt + 2);
5927         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
5928
5929         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
5930
5931         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
5932             goto thats_all_folks;
5933     }
5934
5935 thats_all_folks:
5936     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
5937           memNE((char*)bp - rslen, rsptr, rslen))
5938         goto screamer;                          /* go back to the fray */
5939 thats_really_all_folks:
5940     if (shortbuffered)
5941         cnt += shortbuffered;
5942         DEBUG_P(PerlIO_printf(Perl_debug_log,
5943             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5944     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
5945     DEBUG_P(PerlIO_printf(Perl_debug_log,
5946         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5947         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5948         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5949     *bp = '\0';
5950     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
5951     DEBUG_P(PerlIO_printf(Perl_debug_log,
5952         "Screamer: done, len=%ld, string=|%.*s|\n",
5953         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
5954     }
5955    else
5956     {
5957        /*The big, slow, and stupid way. */
5958 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
5959         STDCHAR *buf = NULL;
5960         Newx(buf, 8192, STDCHAR);
5961         assert(buf);
5962 #else
5963         STDCHAR buf[8192];
5964 #endif
5965
5966 screamer2:
5967         if (rslen) {
5968             register const STDCHAR * const bpe = buf + sizeof(buf);
5969             bp = buf;
5970             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
5971                 ; /* keep reading */
5972             cnt = bp - buf;
5973         }
5974         else {
5975             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
5976             /* Accomodate broken VAXC compiler, which applies U8 cast to
5977              * both args of ?: operator, causing EOF to change into 255
5978              */
5979             if (cnt > 0)
5980                  i = (U8)buf[cnt - 1];
5981             else
5982                  i = EOF;
5983         }
5984
5985         if (cnt < 0)
5986             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
5987         if (append)
5988              sv_catpvn(sv, (char *) buf, cnt);
5989         else
5990              sv_setpvn(sv, (char *) buf, cnt);
5991
5992         if (i != EOF &&                 /* joy */
5993             (!rslen ||
5994              SvCUR(sv) < rslen ||
5995              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
5996         {
5997             append = -1;
5998             /*
5999              * If we're reading from a TTY and we get a short read,
6000              * indicating that the user hit his EOF character, we need
6001              * to notice it now, because if we try to read from the TTY
6002              * again, the EOF condition will disappear.
6003              *
6004              * The comparison of cnt to sizeof(buf) is an optimization
6005              * that prevents unnecessary calls to feof().
6006              *
6007              * - jik 9/25/96
6008              */
6009             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
6010                 goto screamer2;
6011         }
6012
6013 #ifdef USE_HEAP_INSTEAD_OF_STACK
6014         Safefree(buf);
6015 #endif
6016     }
6017
6018     if (rspara) {               /* have to do this both before and after */
6019         while (i != EOF) {      /* to make sure file boundaries work right */
6020             i = PerlIO_getc(fp);
6021             if (i != '\n') {
6022                 PerlIO_ungetc(fp,i);
6023                 break;
6024             }
6025         }
6026     }
6027
6028 return_string_or_null:
6029     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
6030 }
6031
6032 /*
6033 =for apidoc sv_inc
6034
6035 Auto-increment of the value in the SV, doing string to numeric conversion
6036 if necessary. Handles 'get' magic.
6037
6038 =cut
6039 */
6040
6041 void
6042 Perl_sv_inc(pTHX_ register SV *sv)
6043 {
6044     register char *d;
6045     int flags;
6046
6047     if (!sv)
6048         return;
6049     SvGETMAGIC(sv);
6050     if (SvTHINKFIRST(sv)) {
6051         if (SvIsCOW(sv))
6052             sv_force_normal_flags(sv, 0);
6053         if (SvREADONLY(sv)) {
6054             if (IN_PERL_RUNTIME)
6055                 Perl_croak(aTHX_ PL_no_modify);
6056         }
6057         if (SvROK(sv)) {
6058             IV i;
6059             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
6060                 return;
6061             i = PTR2IV(SvRV(sv));
6062             sv_unref(sv);
6063             sv_setiv(sv, i);
6064         }
6065     }
6066     flags = SvFLAGS(sv);
6067     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
6068         /* It's (privately or publicly) a float, but not tested as an
6069            integer, so test it to see. */
6070         (void) SvIV(sv);
6071         flags = SvFLAGS(sv);
6072     }
6073     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6074         /* It's publicly an integer, or privately an integer-not-float */
6075 #ifdef PERL_PRESERVE_IVUV
6076       oops_its_int:
6077 #endif
6078         if (SvIsUV(sv)) {
6079             if (SvUVX(sv) == UV_MAX)
6080                 sv_setnv(sv, UV_MAX_P1);
6081             else
6082                 (void)SvIOK_only_UV(sv);
6083                 SvUV_set(sv, SvUVX(sv) + 1);
6084         } else {
6085             if (SvIVX(sv) == IV_MAX)
6086                 sv_setuv(sv, (UV)IV_MAX + 1);
6087             else {
6088                 (void)SvIOK_only(sv);
6089                 SvIV_set(sv, SvIVX(sv) + 1);
6090             }   
6091         }
6092         return;
6093     }
6094     if (flags & SVp_NOK) {
6095         (void)SvNOK_only(sv);
6096         SvNV_set(sv, SvNVX(sv) + 1.0);
6097         return;
6098     }
6099
6100     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6101         if ((flags & SVTYPEMASK) < SVt_PVIV)
6102             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6103         (void)SvIOK_only(sv);
6104         SvIV_set(sv, 1);
6105         return;
6106     }
6107     d = SvPVX(sv);
6108     while (isALPHA(*d)) d++;
6109     while (isDIGIT(*d)) d++;
6110     if (*d) {
6111 #ifdef PERL_PRESERVE_IVUV
6112         /* Got to punt this as an integer if needs be, but we don't issue
6113            warnings. Probably ought to make the sv_iv_please() that does
6114            the conversion if possible, and silently.  */
6115         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6116         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6117             /* Need to try really hard to see if it's an integer.
6118                9.22337203685478e+18 is an integer.
6119                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6120                so $a="9.22337203685478e+18"; $a+0; $a++
6121                needs to be the same as $a="9.22337203685478e+18"; $a++
6122                or we go insane. */
6123         
6124             (void) sv_2iv(sv);
6125             if (SvIOK(sv))
6126                 goto oops_its_int;
6127
6128             /* sv_2iv *should* have made this an NV */
6129             if (flags & SVp_NOK) {
6130                 (void)SvNOK_only(sv);
6131                 SvNV_set(sv, SvNVX(sv) + 1.0);
6132                 return;
6133             }
6134             /* I don't think we can get here. Maybe I should assert this
6135                And if we do get here I suspect that sv_setnv will croak. NWC
6136                Fall through. */
6137 #if defined(USE_LONG_DOUBLE)
6138             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6139                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6140 #else
6141             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6142                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6143 #endif
6144         }
6145 #endif /* PERL_PRESERVE_IVUV */
6146         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6147         return;
6148     }
6149     d--;
6150     while (d >= SvPVX_const(sv)) {
6151         if (isDIGIT(*d)) {
6152             if (++*d <= '9')
6153                 return;
6154             *(d--) = '0';
6155         }
6156         else {
6157 #ifdef EBCDIC
6158             /* MKS: The original code here died if letters weren't consecutive.
6159              * at least it didn't have to worry about non-C locales.  The
6160              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6161              * arranged in order (although not consecutively) and that only
6162              * [A-Za-z] are accepted by isALPHA in the C locale.
6163              */
6164             if (*d != 'z' && *d != 'Z') {
6165                 do { ++*d; } while (!isALPHA(*d));
6166                 return;
6167             }
6168             *(d--) -= 'z' - 'a';
6169 #else
6170             ++*d;
6171             if (isALPHA(*d))
6172                 return;
6173             *(d--) -= 'z' - 'a' + 1;
6174 #endif
6175         }
6176     }
6177     /* oh,oh, the number grew */
6178     SvGROW(sv, SvCUR(sv) + 2);
6179     SvCUR_set(sv, SvCUR(sv) + 1);
6180     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6181         *d = d[-1];
6182     if (isDIGIT(d[1]))
6183         *d = '1';
6184     else
6185         *d = d[1];
6186 }
6187
6188 /*
6189 =for apidoc sv_dec
6190
6191 Auto-decrement of the value in the SV, doing string to numeric conversion
6192 if necessary. Handles 'get' magic.
6193
6194 =cut
6195 */
6196
6197 void
6198 Perl_sv_dec(pTHX_ register SV *sv)
6199 {
6200     int flags;
6201
6202     if (!sv)
6203         return;
6204     SvGETMAGIC(sv);
6205     if (SvTHINKFIRST(sv)) {
6206         if (SvIsCOW(sv))
6207             sv_force_normal_flags(sv, 0);
6208         if (SvREADONLY(sv)) {
6209             if (IN_PERL_RUNTIME)
6210                 Perl_croak(aTHX_ PL_no_modify);
6211         }
6212         if (SvROK(sv)) {
6213             IV i;
6214             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6215                 return;
6216             i = PTR2IV(SvRV(sv));
6217             sv_unref(sv);
6218             sv_setiv(sv, i);
6219         }
6220     }
6221     /* Unlike sv_inc we don't have to worry about string-never-numbers
6222        and keeping them magic. But we mustn't warn on punting */
6223     flags = SvFLAGS(sv);
6224     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6225         /* It's publicly an integer, or privately an integer-not-float */
6226 #ifdef PERL_PRESERVE_IVUV
6227       oops_its_int:
6228 #endif
6229         if (SvIsUV(sv)) {
6230             if (SvUVX(sv) == 0) {
6231                 (void)SvIOK_only(sv);
6232                 SvIV_set(sv, -1);
6233             }
6234             else {
6235                 (void)SvIOK_only_UV(sv);
6236                 SvUV_set(sv, SvUVX(sv) - 1);
6237             }   
6238         } else {
6239             if (SvIVX(sv) == IV_MIN)
6240                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6241             else {
6242                 (void)SvIOK_only(sv);
6243                 SvIV_set(sv, SvIVX(sv) - 1);
6244             }   
6245         }
6246         return;
6247     }
6248     if (flags & SVp_NOK) {
6249         SvNV_set(sv, SvNVX(sv) - 1.0);
6250         (void)SvNOK_only(sv);
6251         return;
6252     }
6253     if (!(flags & SVp_POK)) {
6254         if ((flags & SVTYPEMASK) < SVt_PVIV)
6255             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6256         SvIV_set(sv, -1);
6257         (void)SvIOK_only(sv);
6258         return;
6259     }
6260 #ifdef PERL_PRESERVE_IVUV
6261     {
6262         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6263         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6264             /* Need to try really hard to see if it's an integer.
6265                9.22337203685478e+18 is an integer.
6266                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6267                so $a="9.22337203685478e+18"; $a+0; $a--
6268                needs to be the same as $a="9.22337203685478e+18"; $a--
6269                or we go insane. */
6270         
6271             (void) sv_2iv(sv);
6272             if (SvIOK(sv))
6273                 goto oops_its_int;
6274
6275             /* sv_2iv *should* have made this an NV */
6276             if (flags & SVp_NOK) {
6277                 (void)SvNOK_only(sv);
6278                 SvNV_set(sv, SvNVX(sv) - 1.0);
6279                 return;
6280             }
6281             /* I don't think we can get here. Maybe I should assert this
6282                And if we do get here I suspect that sv_setnv will croak. NWC
6283                Fall through. */
6284 #if defined(USE_LONG_DOUBLE)
6285             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6286                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6287 #else
6288             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6289                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6290 #endif
6291         }
6292     }
6293 #endif /* PERL_PRESERVE_IVUV */
6294     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6295 }
6296
6297 /*
6298 =for apidoc sv_mortalcopy
6299
6300 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6301 The new SV is marked as mortal. It will be destroyed "soon", either by an
6302 explicit call to FREETMPS, or by an implicit call at places such as
6303 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6304
6305 =cut
6306 */
6307
6308 /* Make a string that will exist for the duration of the expression
6309  * evaluation.  Actually, it may have to last longer than that, but
6310  * hopefully we won't free it until it has been assigned to a
6311  * permanent location. */
6312
6313 SV *
6314 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6315 {
6316     register SV *sv;
6317
6318     new_SV(sv);
6319     sv_setsv(sv,oldstr);
6320     EXTEND_MORTAL(1);
6321     PL_tmps_stack[++PL_tmps_ix] = sv;
6322     SvTEMP_on(sv);
6323     return sv;
6324 }
6325
6326 /*
6327 =for apidoc sv_newmortal
6328
6329 Creates a new null SV which is mortal.  The reference count of the SV is
6330 set to 1. It will be destroyed "soon", either by an explicit call to
6331 FREETMPS, or by an implicit call at places such as statement boundaries.
6332 See also C<sv_mortalcopy> and C<sv_2mortal>.
6333
6334 =cut
6335 */
6336
6337 SV *
6338 Perl_sv_newmortal(pTHX)
6339 {
6340     register SV *sv;
6341
6342     new_SV(sv);
6343     SvFLAGS(sv) = SVs_TEMP;
6344     EXTEND_MORTAL(1);
6345     PL_tmps_stack[++PL_tmps_ix] = sv;
6346     return sv;
6347 }
6348
6349 /*
6350 =for apidoc sv_2mortal
6351
6352 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6353 by an explicit call to FREETMPS, or by an implicit call at places such as
6354 statement boundaries.  SvTEMP() is turned on which means that the SV's
6355 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6356 and C<sv_mortalcopy>.
6357
6358 =cut
6359 */
6360
6361 SV *
6362 Perl_sv_2mortal(pTHX_ register SV *sv)
6363 {
6364     dVAR;
6365     if (!sv)
6366         return NULL;
6367     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6368         return sv;
6369     EXTEND_MORTAL(1);
6370     PL_tmps_stack[++PL_tmps_ix] = sv;
6371     SvTEMP_on(sv);
6372     return sv;
6373 }
6374
6375 /*
6376 =for apidoc newSVpv
6377
6378 Creates a new SV and copies a string into it.  The reference count for the
6379 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6380 strlen().  For efficiency, consider using C<newSVpvn> instead.
6381
6382 =cut
6383 */
6384
6385 SV *
6386 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6387 {
6388     register SV *sv;
6389
6390     new_SV(sv);
6391     sv_setpvn(sv,s,len ? len : strlen(s));
6392     return sv;
6393 }
6394
6395 /*
6396 =for apidoc newSVpvn
6397
6398 Creates a new SV and copies a string into it.  The reference count for the
6399 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6400 string.  You are responsible for ensuring that the source string is at least
6401 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6402
6403 =cut
6404 */
6405
6406 SV *
6407 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6408 {
6409     register SV *sv;
6410
6411     new_SV(sv);
6412     sv_setpvn(sv,s,len);
6413     return sv;
6414 }
6415
6416
6417 /*
6418 =for apidoc newSVhek
6419
6420 Creates a new SV from the hash key structure.  It will generate scalars that
6421 point to the shared string table where possible. Returns a new (undefined)
6422 SV if the hek is NULL.
6423
6424 =cut
6425 */
6426
6427 SV *
6428 Perl_newSVhek(pTHX_ const HEK *hek)
6429 {
6430     if (!hek) {
6431         SV *sv;
6432
6433         new_SV(sv);
6434         return sv;
6435     }
6436
6437     if (HEK_LEN(hek) == HEf_SVKEY) {
6438         return newSVsv(*(SV**)HEK_KEY(hek));
6439     } else {
6440         const int flags = HEK_FLAGS(hek);
6441         if (flags & HVhek_WASUTF8) {
6442             /* Trouble :-)
6443                Andreas would like keys he put in as utf8 to come back as utf8
6444             */
6445             STRLEN utf8_len = HEK_LEN(hek);
6446             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6447             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6448
6449             SvUTF8_on (sv);
6450             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6451             return sv;
6452         } else if (flags & HVhek_REHASH) {
6453             /* We don't have a pointer to the hv, so we have to replicate the
6454                flag into every HEK. This hv is using custom a hasing
6455                algorithm. Hence we can't return a shared string scalar, as
6456                that would contain the (wrong) hash value, and might get passed
6457                into an hv routine with a regular hash  */
6458
6459             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6460             if (HEK_UTF8(hek))
6461                 SvUTF8_on (sv);
6462             return sv;
6463         }
6464         /* This will be overwhelminly the most common case.  */
6465         return newSVpvn_share(HEK_KEY(hek),
6466                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6467                               HEK_HASH(hek));
6468     }
6469 }
6470
6471 /*
6472 =for apidoc newSVpvn_share
6473
6474 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6475 table. If the string does not already exist in the table, it is created
6476 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6477 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6478 otherwise the hash is computed.  The idea here is that as the string table
6479 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6480 hash lookup will avoid string compare.
6481
6482 =cut
6483 */
6484
6485 SV *
6486 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6487 {
6488     register SV *sv;
6489     bool is_utf8 = FALSE;
6490     if (len < 0) {
6491         STRLEN tmplen = -len;
6492         is_utf8 = TRUE;
6493         /* See the note in hv.c:hv_fetch() --jhi */
6494         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6495         len = tmplen;
6496     }
6497     if (!hash)
6498         PERL_HASH(hash, src, len);
6499     new_SV(sv);
6500     sv_upgrade(sv, SVt_PV);
6501     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6502     SvCUR_set(sv, len);
6503     SvLEN_set(sv, 0);
6504     SvREADONLY_on(sv);
6505     SvFAKE_on(sv);
6506     SvPOK_on(sv);
6507     if (is_utf8)
6508         SvUTF8_on(sv);
6509     return sv;
6510 }
6511
6512
6513 #if defined(PERL_IMPLICIT_CONTEXT)
6514
6515 /* pTHX_ magic can't cope with varargs, so this is a no-context
6516  * version of the main function, (which may itself be aliased to us).
6517  * Don't access this version directly.
6518  */
6519
6520 SV *
6521 Perl_newSVpvf_nocontext(const char* pat, ...)
6522 {
6523     dTHX;
6524     register SV *sv;
6525     va_list args;
6526     va_start(args, pat);
6527     sv = vnewSVpvf(pat, &args);
6528     va_end(args);
6529     return sv;
6530 }
6531 #endif
6532
6533 /*
6534 =for apidoc newSVpvf
6535
6536 Creates a new SV and initializes it with the string formatted like
6537 C<sprintf>.
6538
6539 =cut
6540 */
6541
6542 SV *
6543 Perl_newSVpvf(pTHX_ const char* pat, ...)
6544 {
6545     register SV *sv;
6546     va_list args;
6547     va_start(args, pat);
6548     sv = vnewSVpvf(pat, &args);
6549     va_end(args);
6550     return sv;
6551 }
6552
6553 /* backend for newSVpvf() and newSVpvf_nocontext() */
6554
6555 SV *
6556 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6557 {
6558     register SV *sv;
6559     new_SV(sv);
6560     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6561     return sv;
6562 }
6563
6564 /*
6565 =for apidoc newSVnv
6566
6567 Creates a new SV and copies a floating point value into it.
6568 The reference count for the SV is set to 1.
6569
6570 =cut
6571 */
6572
6573 SV *
6574 Perl_newSVnv(pTHX_ NV n)
6575 {
6576     register SV *sv;
6577
6578     new_SV(sv);
6579     sv_setnv(sv,n);
6580     return sv;
6581 }
6582
6583 /*
6584 =for apidoc newSViv
6585
6586 Creates a new SV and copies an integer into it.  The reference count for the
6587 SV is set to 1.
6588
6589 =cut
6590 */
6591
6592 SV *
6593 Perl_newSViv(pTHX_ IV i)
6594 {
6595     register SV *sv;
6596
6597     new_SV(sv);
6598     sv_setiv(sv,i);
6599     return sv;
6600 }
6601
6602 /*
6603 =for apidoc newSVuv
6604
6605 Creates a new SV and copies an unsigned integer into it.
6606 The reference count for the SV is set to 1.
6607
6608 =cut
6609 */
6610
6611 SV *
6612 Perl_newSVuv(pTHX_ UV u)
6613 {
6614     register SV *sv;
6615
6616     new_SV(sv);
6617     sv_setuv(sv,u);
6618     return sv;
6619 }
6620
6621 /*
6622 =for apidoc newRV_noinc
6623
6624 Creates an RV wrapper for an SV.  The reference count for the original
6625 SV is B<not> incremented.
6626
6627 =cut
6628 */
6629
6630 SV *
6631 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6632 {
6633     register SV *sv;
6634
6635     new_SV(sv);
6636     sv_upgrade(sv, SVt_RV);
6637     SvTEMP_off(tmpRef);
6638     SvRV_set(sv, tmpRef);
6639     SvROK_on(sv);
6640     return sv;
6641 }
6642
6643 /* newRV_inc is the official function name to use now.
6644  * newRV_inc is in fact #defined to newRV in sv.h
6645  */
6646
6647 SV *
6648 Perl_newRV(pTHX_ SV *tmpRef)
6649 {
6650     return newRV_noinc(SvREFCNT_inc(tmpRef));
6651 }
6652
6653 /*
6654 =for apidoc newSVsv
6655
6656 Creates a new SV which is an exact duplicate of the original SV.
6657 (Uses C<sv_setsv>).
6658
6659 =cut
6660 */
6661
6662 SV *
6663 Perl_newSVsv(pTHX_ register SV *old)
6664 {
6665     register SV *sv;
6666
6667     if (!old)
6668         return NULL;
6669     if (SvTYPE(old) == SVTYPEMASK) {
6670         if (ckWARN_d(WARN_INTERNAL))
6671             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6672         return Nullsv;
6673     }
6674     new_SV(sv);
6675     /* SV_GMAGIC is the default for sv_setv()
6676        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6677        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6678     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6679     return sv;
6680 }
6681
6682 /*
6683 =for apidoc sv_reset
6684
6685 Underlying implementation for the C<reset> Perl function.
6686 Note that the perl-level function is vaguely deprecated.
6687
6688 =cut
6689 */
6690
6691 void
6692 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6693 {
6694     dVAR;
6695     char todo[PERL_UCHAR_MAX+1];
6696
6697     if (!stash)
6698         return;
6699
6700     if (!*s) {          /* reset ?? searches */
6701         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6702         if (mg) {
6703             PMOP *pm = (PMOP *) mg->mg_obj;
6704             while (pm) {
6705                 pm->op_pmdynflags &= ~PMdf_USED;
6706                 pm = pm->op_pmnext;
6707             }
6708         }
6709         return;
6710     }
6711
6712     /* reset variables */
6713
6714     if (!HvARRAY(stash))
6715         return;
6716
6717     Zero(todo, 256, char);
6718     while (*s) {
6719         I32 max;
6720         I32 i = (unsigned char)*s;
6721         if (s[1] == '-') {
6722             s += 2;
6723         }
6724         max = (unsigned char)*s++;
6725         for ( ; i <= max; i++) {
6726             todo[i] = 1;
6727         }
6728         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6729             HE *entry;
6730             for (entry = HvARRAY(stash)[i];
6731                  entry;
6732                  entry = HeNEXT(entry))
6733             {
6734                 register GV *gv;
6735                 register SV *sv;
6736
6737                 if (!todo[(U8)*HeKEY(entry)])
6738                     continue;
6739                 gv = (GV*)HeVAL(entry);
6740                 sv = GvSV(gv);
6741                 if (sv) {
6742                     if (SvTHINKFIRST(sv)) {
6743                         if (!SvREADONLY(sv) && SvROK(sv))
6744                             sv_unref(sv);
6745                         /* XXX Is this continue a bug? Why should THINKFIRST
6746                            exempt us from resetting arrays and hashes?  */
6747                         continue;
6748                     }
6749                     SvOK_off(sv);
6750                     if (SvTYPE(sv) >= SVt_PV) {
6751                         SvCUR_set(sv, 0);
6752                         if (SvPVX_const(sv) != Nullch)
6753                             *SvPVX(sv) = '\0';
6754                         SvTAINT(sv);
6755                     }
6756                 }
6757                 if (GvAV(gv)) {
6758                     av_clear(GvAV(gv));
6759                 }
6760                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6761 #if defined(VMS)
6762                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6763 #else /* ! VMS */
6764                     hv_clear(GvHV(gv));
6765 #  if defined(USE_ENVIRON_ARRAY)
6766                     if (gv == PL_envgv)
6767                         my_clearenv();
6768 #  endif /* USE_ENVIRON_ARRAY */
6769 #endif /* VMS */
6770                 }
6771             }
6772         }
6773     }
6774 }
6775
6776 /*
6777 =for apidoc sv_2io
6778
6779 Using various gambits, try to get an IO from an SV: the IO slot if its a
6780 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6781 named after the PV if we're a string.
6782
6783 =cut
6784 */
6785
6786 IO*
6787 Perl_sv_2io(pTHX_ SV *sv)
6788 {
6789     IO* io;
6790     GV* gv;
6791
6792     switch (SvTYPE(sv)) {
6793     case SVt_PVIO:
6794         io = (IO*)sv;
6795         break;
6796     case SVt_PVGV:
6797         gv = (GV*)sv;
6798         io = GvIO(gv);
6799         if (!io)
6800             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6801         break;
6802     default:
6803         if (!SvOK(sv))
6804             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6805         if (SvROK(sv))
6806             return sv_2io(SvRV(sv));
6807         gv = gv_fetchsv(sv, 0, SVt_PVIO);
6808         if (gv)
6809             io = GvIO(gv);
6810         else
6811             io = 0;
6812         if (!io)
6813             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6814         break;
6815     }
6816     return io;
6817 }
6818
6819 /*
6820 =for apidoc sv_2cv
6821
6822 Using various gambits, try to get a CV from an SV; in addition, try if
6823 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6824 The flags in C<lref> are passed to sv_fetchsv.
6825
6826 =cut
6827 */
6828
6829 CV *
6830 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6831 {
6832     dVAR;
6833     GV *gv = Nullgv;
6834     CV *cv = Nullcv;
6835
6836     if (!sv)
6837         return *st = NULL, *gvp = Nullgv, Nullcv;
6838     switch (SvTYPE(sv)) {
6839     case SVt_PVCV:
6840         *st = CvSTASH(sv);
6841         *gvp = Nullgv;
6842         return (CV*)sv;
6843     case SVt_PVHV:
6844     case SVt_PVAV:
6845         *st = NULL;
6846         *gvp = Nullgv;
6847         return Nullcv;
6848     case SVt_PVGV:
6849         gv = (GV*)sv;
6850         *gvp = gv;
6851         *st = GvESTASH(gv);
6852         goto fix_gv;
6853
6854     default:
6855         SvGETMAGIC(sv);
6856         if (SvROK(sv)) {
6857             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6858             tryAMAGICunDEREF(to_cv);
6859
6860             sv = SvRV(sv);
6861             if (SvTYPE(sv) == SVt_PVCV) {
6862                 cv = (CV*)sv;
6863                 *gvp = Nullgv;
6864                 *st = CvSTASH(cv);
6865                 return cv;
6866             }
6867             else if(isGV(sv))
6868                 gv = (GV*)sv;
6869             else
6870                 Perl_croak(aTHX_ "Not a subroutine reference");
6871         }
6872         else if (isGV(sv))
6873             gv = (GV*)sv;
6874         else
6875             gv = gv_fetchsv(sv, lref, SVt_PVCV);
6876         *gvp = gv;
6877         if (!gv) {
6878             *st = NULL;
6879             return Nullcv;
6880         }
6881         /* Some flags to gv_fetchsv mean don't really create the GV  */
6882         if (SvTYPE(gv) != SVt_PVGV) {
6883             *st = NULL;
6884             return NULL;
6885         }
6886         *st = GvESTASH(gv);
6887     fix_gv:
6888         if (lref && !GvCVu(gv)) {
6889             SV *tmpsv;
6890             ENTER;
6891             tmpsv = NEWSV(704,0);
6892             gv_efullname3(tmpsv, gv, Nullch);
6893             /* XXX this is probably not what they think they're getting.
6894              * It has the same effect as "sub name;", i.e. just a forward
6895              * declaration! */
6896             newSUB(start_subparse(FALSE, 0),
6897                    newSVOP(OP_CONST, 0, tmpsv),
6898                    Nullop,
6899                    Nullop);
6900             LEAVE;
6901             if (!GvCVu(gv))
6902                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
6903                            sv);
6904         }
6905         return GvCVu(gv);
6906     }
6907 }
6908
6909 /*
6910 =for apidoc sv_true
6911
6912 Returns true if the SV has a true value by Perl's rules.
6913 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
6914 instead use an in-line version.
6915
6916 =cut
6917 */
6918
6919 I32
6920 Perl_sv_true(pTHX_ register SV *sv)
6921 {
6922     if (!sv)
6923         return 0;
6924     if (SvPOK(sv)) {
6925         register const XPV* const tXpv = (XPV*)SvANY(sv);
6926         if (tXpv &&
6927                 (tXpv->xpv_cur > 1 ||
6928                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
6929             return 1;
6930         else
6931             return 0;
6932     }
6933     else {
6934         if (SvIOK(sv))
6935             return SvIVX(sv) != 0;
6936         else {
6937             if (SvNOK(sv))
6938                 return SvNVX(sv) != 0.0;
6939             else
6940                 return sv_2bool(sv);
6941         }
6942     }
6943 }
6944
6945 /*
6946 =for apidoc sv_pvn_force
6947
6948 Get a sensible string out of the SV somehow.
6949 A private implementation of the C<SvPV_force> macro for compilers which
6950 can't cope with complex macro expressions. Always use the macro instead.
6951
6952 =for apidoc sv_pvn_force_flags
6953
6954 Get a sensible string out of the SV somehow.
6955 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
6956 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
6957 implemented in terms of this function.
6958 You normally want to use the various wrapper macros instead: see
6959 C<SvPV_force> and C<SvPV_force_nomg>
6960
6961 =cut
6962 */
6963
6964 char *
6965 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
6966 {
6967
6968     if (SvTHINKFIRST(sv) && !SvROK(sv))
6969         sv_force_normal_flags(sv, 0);
6970
6971     if (SvPOK(sv)) {
6972         if (lp)
6973             *lp = SvCUR(sv);
6974     }
6975     else {
6976         char *s;
6977         STRLEN len;
6978  
6979         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
6980             const char * const ref = sv_reftype(sv,0);
6981             if (PL_op)
6982                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
6983                            ref, OP_NAME(PL_op));
6984             else
6985                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
6986         }
6987         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
6988             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
6989                 OP_NAME(PL_op));
6990         s = sv_2pv_flags(sv, &len, flags);
6991         if (lp)
6992             *lp = len;
6993
6994         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
6995             if (SvROK(sv))
6996                 sv_unref(sv);
6997             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
6998             SvGROW(sv, len + 1);
6999             Move(s,SvPVX(sv),len,char);
7000             SvCUR_set(sv, len);
7001             *SvEND(sv) = '\0';
7002         }
7003         if (!SvPOK(sv)) {
7004             SvPOK_on(sv);               /* validate pointer */
7005             SvTAINT(sv);
7006             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
7007                                   PTR2UV(sv),SvPVX_const(sv)));
7008         }
7009     }
7010     return SvPVX_mutable(sv);
7011 }
7012
7013 /*
7014 =for apidoc sv_pvbyten_force
7015
7016 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
7017
7018 =cut
7019 */
7020
7021 char *
7022 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
7023 {
7024     sv_pvn_force(sv,lp);
7025     sv_utf8_downgrade(sv,0);
7026     *lp = SvCUR(sv);
7027     return SvPVX(sv);
7028 }
7029
7030 /*
7031 =for apidoc sv_pvutf8n_force
7032
7033 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
7034
7035 =cut
7036 */
7037
7038 char *
7039 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
7040 {
7041     sv_pvn_force(sv,lp);
7042     sv_utf8_upgrade(sv);
7043     *lp = SvCUR(sv);
7044     return SvPVX(sv);
7045 }
7046
7047 /*
7048 =for apidoc sv_reftype
7049
7050 Returns a string describing what the SV is a reference to.
7051
7052 =cut
7053 */
7054
7055 char *
7056 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
7057 {
7058     /* The fact that I don't need to downcast to char * everywhere, only in ?:
7059        inside return suggests a const propagation bug in g++.  */
7060     if (ob && SvOBJECT(sv)) {
7061         char * const name = HvNAME_get(SvSTASH(sv));
7062         return name ? name : (char *) "__ANON__";
7063     }
7064     else {
7065         switch (SvTYPE(sv)) {
7066         case SVt_NULL:
7067         case SVt_IV:
7068         case SVt_NV:
7069         case SVt_RV:
7070         case SVt_PV:
7071         case SVt_PVIV:
7072         case SVt_PVNV:
7073         case SVt_PVMG:
7074         case SVt_PVBM:
7075                                 if (SvVOK(sv))
7076                                     return "VSTRING";
7077                                 if (SvROK(sv))
7078                                     return "REF";
7079                                 else
7080                                     return "SCALAR";
7081
7082         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
7083                                 /* tied lvalues should appear to be
7084                                  * scalars for backwards compatitbility */
7085                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
7086                                     ? "SCALAR" : "LVALUE");
7087         case SVt_PVAV:          return "ARRAY";
7088         case SVt_PVHV:          return "HASH";
7089         case SVt_PVCV:          return "CODE";
7090         case SVt_PVGV:          return "GLOB";
7091         case SVt_PVFM:          return "FORMAT";
7092         case SVt_PVIO:          return "IO";
7093         default:                return "UNKNOWN";
7094         }
7095     }
7096 }
7097
7098 /*
7099 =for apidoc sv_isobject
7100
7101 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7102 object.  If the SV is not an RV, or if the object is not blessed, then this
7103 will return false.
7104
7105 =cut
7106 */
7107
7108 int
7109 Perl_sv_isobject(pTHX_ SV *sv)
7110 {
7111     if (!sv)
7112         return 0;
7113     SvGETMAGIC(sv);
7114     if (!SvROK(sv))
7115         return 0;
7116     sv = (SV*)SvRV(sv);
7117     if (!SvOBJECT(sv))
7118         return 0;
7119     return 1;
7120 }
7121
7122 /*
7123 =for apidoc sv_isa
7124
7125 Returns a boolean indicating whether the SV is blessed into the specified
7126 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7127 an inheritance relationship.
7128
7129 =cut
7130 */
7131
7132 int
7133 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7134 {
7135     const char *hvname;
7136     if (!sv)
7137         return 0;
7138     SvGETMAGIC(sv);
7139     if (!SvROK(sv))
7140         return 0;
7141     sv = (SV*)SvRV(sv);
7142     if (!SvOBJECT(sv))
7143         return 0;
7144     hvname = HvNAME_get(SvSTASH(sv));
7145     if (!hvname)
7146         return 0;
7147
7148     return strEQ(hvname, name);
7149 }
7150
7151 /*
7152 =for apidoc newSVrv
7153
7154 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7155 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7156 be blessed in the specified package.  The new SV is returned and its
7157 reference count is 1.
7158
7159 =cut
7160 */
7161
7162 SV*
7163 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7164 {
7165     SV *sv;
7166
7167     new_SV(sv);
7168
7169     SV_CHECK_THINKFIRST_COW_DROP(rv);
7170     SvAMAGIC_off(rv);
7171
7172     if (SvTYPE(rv) >= SVt_PVMG) {
7173         const U32 refcnt = SvREFCNT(rv);
7174         SvREFCNT(rv) = 0;
7175         sv_clear(rv);
7176         SvFLAGS(rv) = 0;
7177         SvREFCNT(rv) = refcnt;
7178     }
7179
7180     if (SvTYPE(rv) < SVt_RV)
7181         sv_upgrade(rv, SVt_RV);
7182     else if (SvTYPE(rv) > SVt_RV) {
7183         SvPV_free(rv);
7184         SvCUR_set(rv, 0);
7185         SvLEN_set(rv, 0);
7186     }
7187
7188     SvOK_off(rv);
7189     SvRV_set(rv, sv);
7190     SvROK_on(rv);
7191
7192     if (classname) {
7193         HV* const stash = gv_stashpv(classname, TRUE);
7194         (void)sv_bless(rv, stash);
7195     }
7196     return sv;
7197 }
7198
7199 /*
7200 =for apidoc sv_setref_pv
7201
7202 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7203 argument will be upgraded to an RV.  That RV will be modified to point to
7204 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7205 into the SV.  The C<classname> argument indicates the package for the
7206 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7207 will have a reference count of 1, and the RV will be returned.
7208
7209 Do not use with other Perl types such as HV, AV, SV, CV, because those
7210 objects will become corrupted by the pointer copy process.
7211
7212 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7213
7214 =cut
7215 */
7216
7217 SV*
7218 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7219 {
7220     if (!pv) {
7221         sv_setsv(rv, &PL_sv_undef);
7222         SvSETMAGIC(rv);
7223     }
7224     else
7225         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7226     return rv;
7227 }
7228
7229 /*
7230 =for apidoc sv_setref_iv
7231
7232 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7233 argument will be upgraded to an RV.  That RV will be modified to point to
7234 the new SV.  The C<classname> argument indicates the package for the
7235 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7236 will have a reference count of 1, and the RV will be returned.
7237
7238 =cut
7239 */
7240
7241 SV*
7242 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7243 {
7244     sv_setiv(newSVrv(rv,classname), iv);
7245     return rv;
7246 }
7247
7248 /*
7249 =for apidoc sv_setref_uv
7250
7251 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7252 argument will be upgraded to an RV.  That RV will be modified to point to
7253 the new SV.  The C<classname> argument indicates the package for the
7254 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7255 will have a reference count of 1, and the RV will be returned.
7256
7257 =cut
7258 */
7259
7260 SV*
7261 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7262 {
7263     sv_setuv(newSVrv(rv,classname), uv);
7264     return rv;
7265 }
7266
7267 /*
7268 =for apidoc sv_setref_nv
7269
7270 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7271 argument will be upgraded to an RV.  That RV will be modified to point to
7272 the new SV.  The C<classname> argument indicates the package for the
7273 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7274 will have a reference count of 1, and the RV will be returned.
7275
7276 =cut
7277 */
7278
7279 SV*
7280 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7281 {
7282     sv_setnv(newSVrv(rv,classname), nv);
7283     return rv;
7284 }
7285
7286 /*
7287 =for apidoc sv_setref_pvn
7288
7289 Copies a string into a new SV, optionally blessing the SV.  The length of the
7290 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7291 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7292 argument indicates the package for the blessing.  Set C<classname> to
7293 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7294 of 1, and the RV will be returned.
7295
7296 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7297
7298 =cut
7299 */
7300
7301 SV*
7302 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7303 {
7304     sv_setpvn(newSVrv(rv,classname), pv, n);
7305     return rv;
7306 }
7307
7308 /*
7309 =for apidoc sv_bless
7310
7311 Blesses an SV into a specified package.  The SV must be an RV.  The package
7312 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7313 of the SV is unaffected.
7314
7315 =cut
7316 */
7317
7318 SV*
7319 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7320 {
7321     SV *tmpRef;
7322     if (!SvROK(sv))
7323         Perl_croak(aTHX_ "Can't bless non-reference value");
7324     tmpRef = SvRV(sv);
7325     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7326         if (SvREADONLY(tmpRef))
7327             Perl_croak(aTHX_ PL_no_modify);
7328         if (SvOBJECT(tmpRef)) {
7329             if (SvTYPE(tmpRef) != SVt_PVIO)
7330                 --PL_sv_objcount;
7331             SvREFCNT_dec(SvSTASH(tmpRef));
7332         }
7333     }
7334     SvOBJECT_on(tmpRef);
7335     if (SvTYPE(tmpRef) != SVt_PVIO)
7336         ++PL_sv_objcount;
7337     SvUPGRADE(tmpRef, SVt_PVMG);
7338     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7339
7340     if (Gv_AMG(stash))
7341         SvAMAGIC_on(sv);
7342     else
7343         SvAMAGIC_off(sv);
7344
7345     if(SvSMAGICAL(tmpRef))
7346         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7347             mg_set(tmpRef);
7348
7349
7350
7351     return sv;
7352 }
7353
7354 /* Downgrades a PVGV to a PVMG.
7355  */
7356
7357 STATIC void
7358 S_sv_unglob(pTHX_ SV *sv)
7359 {
7360     void *xpvmg;
7361
7362     assert(SvTYPE(sv) == SVt_PVGV);
7363     SvFAKE_off(sv);
7364     if (GvGP(sv))
7365         gp_free((GV*)sv);
7366     if (GvSTASH(sv)) {
7367         sv_del_backref((SV*)GvSTASH(sv), sv);
7368         GvSTASH(sv) = NULL;
7369     }
7370     sv_unmagic(sv, PERL_MAGIC_glob);
7371     Safefree(GvNAME(sv));
7372     GvMULTI_off(sv);
7373
7374     /* need to keep SvANY(sv) in the right arena */
7375     xpvmg = new_XPVMG();
7376     StructCopy(SvANY(sv), xpvmg, XPVMG);
7377     del_XPVGV(SvANY(sv));
7378     SvANY(sv) = xpvmg;
7379
7380     SvFLAGS(sv) &= ~SVTYPEMASK;
7381     SvFLAGS(sv) |= SVt_PVMG;
7382 }
7383
7384 /*
7385 =for apidoc sv_unref_flags
7386
7387 Unsets the RV status of the SV, and decrements the reference count of
7388 whatever was being referenced by the RV.  This can almost be thought of
7389 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7390 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7391 (otherwise the decrementing is conditional on the reference count being
7392 different from one or the reference being a readonly SV).
7393 See C<SvROK_off>.
7394
7395 =cut
7396 */
7397
7398 void
7399 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7400 {
7401     SV* const target = SvRV(ref);
7402
7403     if (SvWEAKREF(ref)) {
7404         sv_del_backref(target, ref);
7405         SvWEAKREF_off(ref);
7406         SvRV_set(ref, NULL);
7407         return;
7408     }
7409     SvRV_set(ref, NULL);
7410     SvROK_off(ref);
7411     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7412        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7413     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7414         SvREFCNT_dec(target);
7415     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7416         sv_2mortal(target);     /* Schedule for freeing later */
7417 }
7418
7419 /*
7420 =for apidoc sv_untaint
7421
7422 Untaint an SV. Use C<SvTAINTED_off> instead.
7423 =cut
7424 */
7425
7426 void
7427 Perl_sv_untaint(pTHX_ SV *sv)
7428 {
7429     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7430         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7431         if (mg)
7432             mg->mg_len &= ~1;
7433     }
7434 }
7435
7436 /*
7437 =for apidoc sv_tainted
7438
7439 Test an SV for taintedness. Use C<SvTAINTED> instead.
7440 =cut
7441 */
7442
7443 bool
7444 Perl_sv_tainted(pTHX_ SV *sv)
7445 {
7446     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7447         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7448         if (mg && (mg->mg_len & 1) )
7449             return TRUE;
7450     }
7451     return FALSE;
7452 }
7453
7454 /*
7455 =for apidoc sv_setpviv
7456
7457 Copies an integer into the given SV, also updating its string value.
7458 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7459
7460 =cut
7461 */
7462
7463 void
7464 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7465 {
7466     char buf[TYPE_CHARS(UV)];
7467     char *ebuf;
7468     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7469
7470     sv_setpvn(sv, ptr, ebuf - ptr);
7471 }
7472
7473 /*
7474 =for apidoc sv_setpviv_mg
7475
7476 Like C<sv_setpviv>, but also handles 'set' magic.
7477
7478 =cut
7479 */
7480
7481 void
7482 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7483 {
7484     sv_setpviv(sv, iv);
7485     SvSETMAGIC(sv);
7486 }
7487
7488 #if defined(PERL_IMPLICIT_CONTEXT)
7489
7490 /* pTHX_ magic can't cope with varargs, so this is a no-context
7491  * version of the main function, (which may itself be aliased to us).
7492  * Don't access this version directly.
7493  */
7494
7495 void
7496 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7497 {
7498     dTHX;
7499     va_list args;
7500     va_start(args, pat);
7501     sv_vsetpvf(sv, pat, &args);
7502     va_end(args);
7503 }
7504
7505 /* pTHX_ magic can't cope with varargs, so this is a no-context
7506  * version of the main function, (which may itself be aliased to us).
7507  * Don't access this version directly.
7508  */
7509
7510 void
7511 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7512 {
7513     dTHX;
7514     va_list args;
7515     va_start(args, pat);
7516     sv_vsetpvf_mg(sv, pat, &args);
7517     va_end(args);
7518 }
7519 #endif
7520
7521 /*
7522 =for apidoc sv_setpvf
7523
7524 Works like C<sv_catpvf> but copies the text into the SV instead of
7525 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7526
7527 =cut
7528 */
7529
7530 void
7531 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7532 {
7533     va_list args;
7534     va_start(args, pat);
7535     sv_vsetpvf(sv, pat, &args);
7536     va_end(args);
7537 }
7538
7539 /*
7540 =for apidoc sv_vsetpvf
7541
7542 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7543 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7544
7545 Usually used via its frontend C<sv_setpvf>.
7546
7547 =cut
7548 */
7549
7550 void
7551 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7552 {
7553     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7554 }
7555
7556 /*
7557 =for apidoc sv_setpvf_mg
7558
7559 Like C<sv_setpvf>, but also handles 'set' magic.
7560
7561 =cut
7562 */
7563
7564 void
7565 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7566 {
7567     va_list args;
7568     va_start(args, pat);
7569     sv_vsetpvf_mg(sv, pat, &args);
7570     va_end(args);
7571 }
7572
7573 /*
7574 =for apidoc sv_vsetpvf_mg
7575
7576 Like C<sv_vsetpvf>, but also handles 'set' magic.
7577
7578 Usually used via its frontend C<sv_setpvf_mg>.
7579
7580 =cut
7581 */
7582
7583 void
7584 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7585 {
7586     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7587     SvSETMAGIC(sv);
7588 }
7589
7590 #if defined(PERL_IMPLICIT_CONTEXT)
7591
7592 /* pTHX_ magic can't cope with varargs, so this is a no-context
7593  * version of the main function, (which may itself be aliased to us).
7594  * Don't access this version directly.
7595  */
7596
7597 void
7598 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7599 {
7600     dTHX;
7601     va_list args;
7602     va_start(args, pat);
7603     sv_vcatpvf(sv, pat, &args);
7604     va_end(args);
7605 }
7606
7607 /* pTHX_ magic can't cope with varargs, so this is a no-context
7608  * version of the main function, (which may itself be aliased to us).
7609  * Don't access this version directly.
7610  */
7611
7612 void
7613 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7614 {
7615     dTHX;
7616     va_list args;
7617     va_start(args, pat);
7618     sv_vcatpvf_mg(sv, pat, &args);
7619     va_end(args);
7620 }
7621 #endif
7622
7623 /*
7624 =for apidoc sv_catpvf
7625
7626 Processes its arguments like C<sprintf> and appends the formatted
7627 output to an SV.  If the appended data contains "wide" characters
7628 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7629 and characters >255 formatted with %c), the original SV might get
7630 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7631 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7632 valid UTF-8; if the original SV was bytes, the pattern should be too.
7633
7634 =cut */
7635
7636 void
7637 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7638 {
7639     va_list args;
7640     va_start(args, pat);
7641     sv_vcatpvf(sv, pat, &args);
7642     va_end(args);
7643 }
7644
7645 /*
7646 =for apidoc sv_vcatpvf
7647
7648 Processes its arguments like C<vsprintf> and appends the formatted output
7649 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7650
7651 Usually used via its frontend C<sv_catpvf>.
7652
7653 =cut
7654 */
7655
7656 void
7657 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7658 {
7659     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7660 }
7661
7662 /*
7663 =for apidoc sv_catpvf_mg
7664
7665 Like C<sv_catpvf>, but also handles 'set' magic.
7666
7667 =cut
7668 */
7669
7670 void
7671 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7672 {
7673     va_list args;
7674     va_start(args, pat);
7675     sv_vcatpvf_mg(sv, pat, &args);
7676     va_end(args);
7677 }
7678
7679 /*
7680 =for apidoc sv_vcatpvf_mg
7681
7682 Like C<sv_vcatpvf>, but also handles 'set' magic.
7683
7684 Usually used via its frontend C<sv_catpvf_mg>.
7685
7686 =cut
7687 */
7688
7689 void
7690 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7691 {
7692     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7693     SvSETMAGIC(sv);
7694 }
7695
7696 /*
7697 =for apidoc sv_vsetpvfn
7698
7699 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7700 appending it.
7701
7702 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7703
7704 =cut
7705 */
7706
7707 void
7708 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7709 {
7710     sv_setpvn(sv, "", 0);
7711     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7712 }
7713
7714 STATIC I32
7715 S_expect_number(pTHX_ char** pattern)
7716 {
7717     I32 var = 0;
7718     switch (**pattern) {
7719     case '1': case '2': case '3':
7720     case '4': case '5': case '6':
7721     case '7': case '8': case '9':
7722         var = *(*pattern)++ - '0';
7723         while (isDIGIT(**pattern)) {
7724             I32 tmp = var * 10 + (*(*pattern)++ - '0');
7725             if (tmp < var)
7726                 Perl_croak(aTHX_ "Integer overflow in format string for %s", (PL_op ? OP_NAME(PL_op) : "sv_vcatpvfn"));
7727             var = tmp;
7728         }
7729     }
7730     return var;
7731 }
7732
7733 STATIC char *
7734 S_F0convert(NV nv, char *endbuf, STRLEN *len)
7735 {
7736     const int neg = nv < 0;
7737     UV uv;
7738
7739     if (neg)
7740         nv = -nv;
7741     if (nv < UV_MAX) {
7742         char *p = endbuf;
7743         nv += 0.5;
7744         uv = (UV)nv;
7745         if (uv & 1 && uv == nv)
7746             uv--;                       /* Round to even */
7747         do {
7748             const unsigned dig = uv % 10;
7749             *--p = '0' + dig;
7750         } while (uv /= 10);
7751         if (neg)
7752             *--p = '-';
7753         *len = endbuf - p;
7754         return p;
7755     }
7756     return Nullch;
7757 }
7758
7759
7760 /*
7761 =for apidoc sv_vcatpvfn
7762
7763 Processes its arguments like C<vsprintf> and appends the formatted output
7764 to an SV.  Uses an array of SVs if the C style variable argument list is
7765 missing (NULL).  When running with taint checks enabled, indicates via
7766 C<maybe_tainted> if results are untrustworthy (often due to the use of
7767 locales).
7768
7769 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7770
7771 =cut
7772 */
7773
7774
7775 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7776                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7777                         vec_utf8 = DO_UTF8(vecsv);
7778
7779 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7780
7781 void
7782 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7783 {
7784     char *p;
7785     char *q;
7786     const char *patend;
7787     STRLEN origlen;
7788     I32 svix = 0;
7789     static const char nullstr[] = "(null)";
7790     SV *argsv = Nullsv;
7791     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7792     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7793     SV *nsv = Nullsv;
7794     /* Times 4: a decimal digit takes more than 3 binary digits.
7795      * NV_DIG: mantissa takes than many decimal digits.
7796      * Plus 32: Playing safe. */
7797     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7798     /* large enough for "%#.#f" --chip */
7799     /* what about long double NVs? --jhi */
7800
7801     PERL_UNUSED_ARG(maybe_tainted);
7802
7803     /* no matter what, this is a string now */
7804     (void)SvPV_force(sv, origlen);
7805
7806     /* special-case "", "%s", and "%-p" (SVf - see below) */
7807     if (patlen == 0)
7808         return;
7809     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7810         if (args) {
7811             const char * const s = va_arg(*args, char*);
7812             sv_catpv(sv, s ? s : nullstr);
7813         }
7814         else if (svix < svmax) {
7815             sv_catsv(sv, *svargs);
7816         }
7817         return;
7818     }
7819     if (args && patlen == 3 && pat[0] == '%' &&
7820                 pat[1] == '-' && pat[2] == 'p') {
7821         argsv = va_arg(*args, SV*);
7822         sv_catsv(sv, argsv);
7823         return;
7824     }
7825
7826 #ifndef USE_LONG_DOUBLE
7827     /* special-case "%.<number>[gf]" */
7828     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7829          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7830         unsigned digits = 0;
7831         const char *pp;
7832
7833         pp = pat + 2;
7834         while (*pp >= '0' && *pp <= '9')
7835             digits = 10 * digits + (*pp++ - '0');
7836         if (pp - pat == (int)patlen - 1) {
7837             NV nv;
7838
7839             if (svix < svmax)
7840                 nv = SvNV(*svargs);
7841             else
7842                 return;
7843             if (*pp == 'g') {
7844                 /* Add check for digits != 0 because it seems that some
7845                    gconverts are buggy in this case, and we don't yet have
7846                    a Configure test for this.  */
7847                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7848                      /* 0, point, slack */
7849                     Gconvert(nv, (int)digits, 0, ebuf);
7850                     sv_catpv(sv, ebuf);
7851                     if (*ebuf)  /* May return an empty string for digits==0 */
7852                         return;
7853                 }
7854             } else if (!digits) {
7855                 STRLEN l;
7856
7857                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7858                     sv_catpvn(sv, p, l);
7859                     return;
7860                 }
7861             }
7862         }
7863     }
7864 #endif /* !USE_LONG_DOUBLE */
7865
7866     if (!args && svix < svmax && DO_UTF8(*svargs))
7867         has_utf8 = TRUE;
7868
7869     patend = (char*)pat + patlen;
7870     for (p = (char*)pat; p < patend; p = q) {
7871         bool alt = FALSE;
7872         bool left = FALSE;
7873         bool vectorize = FALSE;
7874         bool vectorarg = FALSE;
7875         bool vec_utf8 = FALSE;
7876         char fill = ' ';
7877         char plus = 0;
7878         char intsize = 0;
7879         STRLEN width = 0;
7880         STRLEN zeros = 0;
7881         bool has_precis = FALSE;
7882         STRLEN precis = 0;
7883         const I32 osvix = svix;
7884         bool is_utf8 = FALSE;  /* is this item utf8?   */
7885 #ifdef HAS_LDBL_SPRINTF_BUG
7886         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
7887            with sfio - Allen <allens@cpan.org> */
7888         bool fix_ldbl_sprintf_bug = FALSE;
7889 #endif
7890
7891         char esignbuf[4];
7892         U8 utf8buf[UTF8_MAXBYTES+1];
7893         STRLEN esignlen = 0;
7894
7895         const char *eptr = Nullch;
7896         STRLEN elen = 0;
7897         SV *vecsv = Nullsv;
7898         const U8 *vecstr = Null(U8*);
7899         STRLEN veclen = 0;
7900         char c = 0;
7901         int i;
7902         unsigned base = 0;
7903         IV iv = 0;
7904         UV uv = 0;
7905         /* we need a long double target in case HAS_LONG_DOUBLE but
7906            not USE_LONG_DOUBLE
7907         */
7908 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
7909         long double nv;
7910 #else
7911         NV nv;
7912 #endif
7913         STRLEN have;
7914         STRLEN need;
7915         STRLEN gap;
7916         const char *dotstr = ".";
7917         STRLEN dotstrlen = 1;
7918         I32 efix = 0; /* explicit format parameter index */
7919         I32 ewix = 0; /* explicit width index */
7920         I32 epix = 0; /* explicit precision index */
7921         I32 evix = 0; /* explicit vector index */
7922         bool asterisk = FALSE;
7923
7924         /* echo everything up to the next format specification */
7925         for (q = p; q < patend && *q != '%'; ++q) ;
7926         if (q > p) {
7927             if (has_utf8 && !pat_utf8)
7928                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
7929             else
7930                 sv_catpvn(sv, p, q - p);
7931             p = q;
7932         }
7933         if (q++ >= patend)
7934             break;
7935
7936 /*
7937     We allow format specification elements in this order:
7938         \d+\$              explicit format parameter index
7939         [-+ 0#]+           flags
7940         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
7941         0                  flag (as above): repeated to allow "v02"     
7942         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
7943         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
7944         [hlqLV]            size
7945     [%bcdefginopsuxDFOUX] format (mandatory)
7946 */
7947
7948         if (args) {
7949 /*  
7950         As of perl5.9.3, printf format checking is on by default.
7951         Internally, perl uses %p formats to provide an escape to
7952         some extended formatting.  This block deals with those
7953         extensions: if it does not match, (char*)q is reset and
7954         the normal format processing code is used.
7955
7956         Currently defined extensions are:
7957                 %p              include pointer address (standard)      
7958                 %-p     (SVf)   include an SV (previously %_)
7959                 %-<num>p        include an SV with precision <num>      
7960                 %1p     (VDf)   include a v-string (as %vd)
7961                 %<num>p         reserved for future extensions
7962
7963         Robin Barker 2005-07-14
7964 */
7965             char* r = q; 
7966             bool sv = FALSE;    
7967             STRLEN n = 0;
7968             if (*q == '-')
7969                 sv = *q++;
7970             n = expect_number(&q);
7971             if (*q++ == 'p') {
7972                 if (sv) {                       /* SVf */
7973                     if (n) {
7974                         precis = n;
7975                         has_precis = TRUE;
7976                     }
7977                     argsv = va_arg(*args, SV*);
7978                     eptr = SvPVx_const(argsv, elen);
7979                     if (DO_UTF8(argsv))
7980                         is_utf8 = TRUE;
7981                     goto string;
7982                 }
7983 #if vdNUMBER
7984                 else if (n == vdNUMBER) {       /* VDf */
7985                     vectorize = TRUE;
7986                     VECTORIZE_ARGS
7987                     goto format_vd;
7988                 }
7989 #endif
7990                 else if (n) {
7991                     if (ckWARN_d(WARN_INTERNAL))
7992                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
7993                         "internal %%<num>p might conflict with future printf extensions");
7994                 }
7995             }
7996             q = r; 
7997         }
7998
7999         if ( (width = expect_number(&q)) ) {
8000             if (*q == '$') {
8001                 ++q;
8002                 efix = width;
8003             } else {
8004                 goto gotwidth;
8005             }
8006         }
8007
8008         /* FLAGS */
8009
8010         while (*q) {
8011             switch (*q) {
8012             case ' ':
8013             case '+':
8014                 plus = *q++;
8015                 continue;
8016
8017             case '-':
8018                 left = TRUE;
8019                 q++;
8020                 continue;
8021
8022             case '0':
8023                 fill = *q++;
8024                 continue;
8025
8026             case '#':
8027                 alt = TRUE;
8028                 q++;
8029                 continue;
8030
8031             default:
8032                 break;
8033             }
8034             break;
8035         }
8036
8037       tryasterisk:
8038         if (*q == '*') {
8039             q++;
8040             if ( (ewix = expect_number(&q)) )
8041                 if (*q++ != '$')
8042                     goto unknown;
8043             asterisk = TRUE;
8044         }
8045         if (*q == 'v') {
8046             q++;
8047             if (vectorize)
8048                 goto unknown;
8049             if ((vectorarg = asterisk)) {
8050                 evix = ewix;
8051                 ewix = 0;
8052                 asterisk = FALSE;
8053             }
8054             vectorize = TRUE;
8055             goto tryasterisk;
8056         }
8057
8058         if (!asterisk)
8059         {
8060             if( *q == '0' )
8061                 fill = *q++;
8062             width = expect_number(&q);
8063         }
8064
8065         if (vectorize) {
8066             if (vectorarg) {
8067                 if (args)
8068                     vecsv = va_arg(*args, SV*);
8069                 else if (evix) {
8070                     vecsv = (evix > 0 && evix <= svmax)
8071                         ? svargs[evix-1] : &PL_sv_undef;
8072                 } else {
8073                     vecsv = svix < svmax ? svargs[svix++] : &PL_sv_undef;
8074                 }
8075                 dotstr = SvPV_const(vecsv, dotstrlen);
8076                 /* Keep the DO_UTF8 test *after* the SvPV call, else things go
8077                    bad with tied or overloaded values that return UTF8.  */
8078                 if (DO_UTF8(vecsv))
8079                     is_utf8 = TRUE;
8080                 else if (has_utf8) {
8081                     vecsv = sv_mortalcopy(vecsv);
8082                     sv_utf8_upgrade(vecsv);
8083                     dotstr = SvPV_const(vecsv, dotstrlen);
8084                     is_utf8 = TRUE;
8085                 }                   
8086             }
8087             if (args) {
8088                 VECTORIZE_ARGS
8089             }
8090             else if (efix ? (efix > 0 && efix <= svmax) : svix < svmax) {
8091                 vecsv = svargs[efix ? efix-1 : svix++];
8092                 vecstr = (U8*)SvPV_const(vecsv,veclen);
8093                 vec_utf8 = DO_UTF8(vecsv);
8094
8095                 /* if this is a version object, we need to convert
8096                  * back into v-string notation and then let the
8097                  * vectorize happen normally
8098                  */
8099                 if (sv_derived_from(vecsv, "version")) {
8100                     char *version = savesvpv(vecsv);
8101                     vecsv = sv_newmortal();
8102                     /* scan_vstring is expected to be called during
8103                      * tokenization, so we need to fake up the end
8104                      * of the buffer for it
8105                      */
8106                     PL_bufend = version + veclen;
8107                     scan_vstring(version, vecsv);
8108                     vecstr = (U8*)SvPV_const(vecsv, veclen);
8109                     vec_utf8 = DO_UTF8(vecsv);
8110                     Safefree(version);
8111                 }
8112             }
8113             else {
8114                 vecstr = (U8*)"";
8115                 veclen = 0;
8116             }
8117         }
8118
8119         if (asterisk) {
8120             if (args)
8121                 i = va_arg(*args, int);
8122             else
8123                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8124                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8125             left |= (i < 0);
8126             width = (i < 0) ? -i : i;
8127         }
8128       gotwidth:
8129
8130         /* PRECISION */
8131
8132         if (*q == '.') {
8133             q++;
8134             if (*q == '*') {
8135                 q++;
8136                 if ( ((epix = expect_number(&q))) && (*q++ != '$') )
8137                     goto unknown;
8138                 /* XXX: todo, support specified precision parameter */
8139                 if (epix)
8140                     goto unknown;
8141                 if (args)
8142                     i = va_arg(*args, int);
8143                 else
8144                     i = (ewix ? ewix <= svmax : svix < svmax)
8145                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8146                 precis = (i < 0) ? 0 : i;
8147             }
8148             else {
8149                 precis = 0;
8150                 while (isDIGIT(*q))
8151                     precis = precis * 10 + (*q++ - '0');
8152             }
8153             has_precis = TRUE;
8154         }
8155
8156         /* SIZE */
8157
8158         switch (*q) {
8159 #ifdef WIN32
8160         case 'I':                       /* Ix, I32x, and I64x */
8161 #  ifdef WIN64
8162             if (q[1] == '6' && q[2] == '4') {
8163                 q += 3;
8164                 intsize = 'q';
8165                 break;
8166             }
8167 #  endif
8168             if (q[1] == '3' && q[2] == '2') {
8169                 q += 3;
8170                 break;
8171             }
8172 #  ifdef WIN64
8173             intsize = 'q';
8174 #  endif
8175             q++;
8176             break;
8177 #endif
8178 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8179         case 'L':                       /* Ld */
8180             /* FALL THROUGH */
8181 #ifdef HAS_QUAD
8182         case 'q':                       /* qd */
8183 #endif
8184             intsize = 'q';
8185             q++;
8186             break;
8187 #endif
8188         case 'l':
8189 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8190             if (*(q + 1) == 'l') {      /* lld, llf */
8191                 intsize = 'q';
8192                 q += 2;
8193                 break;
8194              }
8195 #endif
8196             /* FALL THROUGH */
8197         case 'h':
8198             /* FALL THROUGH */
8199         case 'V':
8200             intsize = *q++;
8201             break;
8202         }
8203
8204         /* CONVERSION */
8205
8206         if (*q == '%') {
8207             eptr = q++;
8208             elen = 1;
8209             if (vectorize) {
8210                 c = '%';
8211                 goto unknown;
8212             }
8213             goto string;
8214         }
8215
8216         if (!vectorize && !args) {
8217             if (efix) {
8218                 const I32 i = efix-1;
8219                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8220             } else {
8221                 argsv = (svix >= 0 && svix < svmax)
8222                     ? svargs[svix++] : &PL_sv_undef;
8223             }
8224         }
8225
8226         switch (c = *q++) {
8227
8228             /* STRINGS */
8229
8230         case 'c':
8231             if (vectorize)
8232                 goto unknown;
8233             uv = (args) ? va_arg(*args, int) : SvIVx(argsv);
8234             if ((uv > 255 ||
8235                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8236                 && !IN_BYTES) {
8237                 eptr = (char*)utf8buf;
8238                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8239                 is_utf8 = TRUE;
8240             }
8241             else {
8242                 c = (char)uv;
8243                 eptr = &c;
8244                 elen = 1;
8245             }
8246             goto string;
8247
8248         case 's':
8249             if (vectorize)
8250                 goto unknown;
8251             if (args) {
8252                 eptr = va_arg(*args, char*);
8253                 if (eptr)
8254 #ifdef MACOS_TRADITIONAL
8255                   /* On MacOS, %#s format is used for Pascal strings */
8256                   if (alt)
8257                     elen = *eptr++;
8258                   else
8259 #endif
8260                     elen = strlen(eptr);
8261                 else {
8262                     eptr = (char *)nullstr;
8263                     elen = sizeof nullstr - 1;
8264                 }
8265             }
8266             else {
8267                 eptr = SvPVx_const(argsv, elen);
8268                 if (DO_UTF8(argsv)) {
8269                     if (has_precis && precis < elen) {
8270                         I32 p = precis;
8271                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8272                         precis = p;
8273                     }
8274                     if (width) { /* fudge width (can't fudge elen) */
8275                         width += elen - sv_len_utf8(argsv);
8276                     }
8277                     is_utf8 = TRUE;
8278                 }
8279             }
8280
8281         string:
8282             if (has_precis && elen > precis)
8283                 elen = precis;
8284             break;
8285
8286             /* INTEGERS */
8287
8288         case 'p':
8289             if (alt || vectorize)
8290                 goto unknown;
8291             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8292             base = 16;
8293             goto integer;
8294
8295         case 'D':
8296 #ifdef IV_IS_QUAD
8297             intsize = 'q';
8298 #else
8299             intsize = 'l';
8300 #endif
8301             /* FALL THROUGH */
8302         case 'd':
8303         case 'i':
8304 #if vdNUMBER
8305         format_vd:
8306 #endif
8307             if (vectorize) {
8308                 STRLEN ulen;
8309                 if (!veclen)
8310                     continue;
8311                 if (vec_utf8)
8312                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8313                                         UTF8_ALLOW_ANYUV);
8314                 else {
8315                     uv = *vecstr;
8316                     ulen = 1;
8317                 }
8318                 vecstr += ulen;
8319                 veclen -= ulen;
8320                 if (plus)
8321                      esignbuf[esignlen++] = plus;
8322             }
8323             else if (args) {
8324                 switch (intsize) {
8325                 case 'h':       iv = (short)va_arg(*args, int); break;
8326                 case 'l':       iv = va_arg(*args, long); break;
8327                 case 'V':       iv = va_arg(*args, IV); break;
8328                 default:        iv = va_arg(*args, int); break;
8329 #ifdef HAS_QUAD
8330                 case 'q':       iv = va_arg(*args, Quad_t); break;
8331 #endif
8332                 }
8333             }
8334             else {
8335                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8336                 switch (intsize) {
8337                 case 'h':       iv = (short)tiv; break;
8338                 case 'l':       iv = (long)tiv; break;
8339                 case 'V':
8340                 default:        iv = tiv; break;
8341 #ifdef HAS_QUAD
8342                 case 'q':       iv = (Quad_t)tiv; break;
8343 #endif
8344                 }
8345             }
8346             if ( !vectorize )   /* we already set uv above */
8347             {
8348                 if (iv >= 0) {
8349                     uv = iv;
8350                     if (plus)
8351                         esignbuf[esignlen++] = plus;
8352                 }
8353                 else {
8354                     uv = -iv;
8355                     esignbuf[esignlen++] = '-';
8356                 }
8357             }
8358             base = 10;
8359             goto integer;
8360
8361         case 'U':
8362 #ifdef IV_IS_QUAD
8363             intsize = 'q';
8364 #else
8365             intsize = 'l';
8366 #endif
8367             /* FALL THROUGH */
8368         case 'u':
8369             base = 10;
8370             goto uns_integer;
8371
8372         case 'b':
8373             base = 2;
8374             goto uns_integer;
8375
8376         case 'O':
8377 #ifdef IV_IS_QUAD
8378             intsize = 'q';
8379 #else
8380             intsize = 'l';
8381 #endif
8382             /* FALL THROUGH */
8383         case 'o':
8384             base = 8;
8385             goto uns_integer;
8386
8387         case 'X':
8388         case 'x':
8389             base = 16;
8390
8391         uns_integer:
8392             if (vectorize) {
8393                 STRLEN ulen;
8394         vector:
8395                 if (!veclen)
8396                     continue;
8397                 if (vec_utf8)
8398                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8399                                         UTF8_ALLOW_ANYUV);
8400                 else {
8401                     uv = *vecstr;
8402                     ulen = 1;
8403                 }
8404                 vecstr += ulen;
8405                 veclen -= ulen;
8406             }
8407             else if (args) {
8408                 switch (intsize) {
8409                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8410                 case 'l':  uv = va_arg(*args, unsigned long); break;
8411                 case 'V':  uv = va_arg(*args, UV); break;
8412                 default:   uv = va_arg(*args, unsigned); break;
8413 #ifdef HAS_QUAD
8414                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8415 #endif
8416                 }
8417             }
8418             else {
8419                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8420                 switch (intsize) {
8421                 case 'h':       uv = (unsigned short)tuv; break;
8422                 case 'l':       uv = (unsigned long)tuv; break;
8423                 case 'V':
8424                 default:        uv = tuv; break;
8425 #ifdef HAS_QUAD
8426                 case 'q':       uv = (Uquad_t)tuv; break;
8427 #endif
8428                 }
8429             }
8430
8431         integer:
8432             {
8433                 char *ptr = ebuf + sizeof ebuf;
8434                 switch (base) {
8435                     unsigned dig;
8436                 case 16:
8437                     if (!uv)
8438                         alt = FALSE;
8439                     p = (char*)((c == 'X')
8440                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8441                     do {
8442                         dig = uv & 15;
8443                         *--ptr = p[dig];
8444                     } while (uv >>= 4);
8445                     if (alt) {
8446                         esignbuf[esignlen++] = '0';
8447                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8448                     }
8449                     break;
8450                 case 8:
8451                     do {
8452                         dig = uv & 7;
8453                         *--ptr = '0' + dig;
8454                     } while (uv >>= 3);
8455                     if (alt && *ptr != '0')
8456                         *--ptr = '0';
8457                     break;
8458                 case 2:
8459                     if (!uv)
8460                         alt = FALSE;
8461                     do {
8462                         dig = uv & 1;
8463                         *--ptr = '0' + dig;
8464                     } while (uv >>= 1);
8465                     if (alt) {
8466                         esignbuf[esignlen++] = '0';
8467                         esignbuf[esignlen++] = 'b';
8468                     }
8469                     break;
8470                 default:                /* it had better be ten or less */
8471                     do {
8472                         dig = uv % base;
8473                         *--ptr = '0' + dig;
8474                     } while (uv /= base);
8475                     break;
8476                 }
8477                 elen = (ebuf + sizeof ebuf) - ptr;
8478                 eptr = ptr;
8479                 if (has_precis) {
8480                     if (precis > elen)
8481                         zeros = precis - elen;
8482                     else if (precis == 0 && elen == 1 && *eptr == '0')
8483                         elen = 0;
8484                 }
8485             }
8486             break;
8487
8488             /* FLOATING POINT */
8489
8490         case 'F':
8491             c = 'f';            /* maybe %F isn't supported here */
8492             /* FALL THROUGH */
8493         case 'e': case 'E':
8494         case 'f':
8495         case 'g': case 'G':
8496             if (vectorize)
8497                 goto unknown;
8498
8499             /* This is evil, but floating point is even more evil */
8500
8501             /* for SV-style calling, we can only get NV
8502                for C-style calling, we assume %f is double;
8503                for simplicity we allow any of %Lf, %llf, %qf for long double
8504             */
8505             switch (intsize) {
8506             case 'V':
8507 #if defined(USE_LONG_DOUBLE)
8508                 intsize = 'q';
8509 #endif
8510                 break;
8511 /* [perl #20339] - we should accept and ignore %lf rather than die */
8512             case 'l':
8513                 /* FALL THROUGH */
8514             default:
8515 #if defined(USE_LONG_DOUBLE)
8516                 intsize = args ? 0 : 'q';
8517 #endif
8518                 break;
8519             case 'q':
8520 #if defined(HAS_LONG_DOUBLE)
8521                 break;
8522 #else
8523                 /* FALL THROUGH */
8524 #endif
8525             case 'h':
8526                 goto unknown;
8527             }
8528
8529             /* now we need (long double) if intsize == 'q', else (double) */
8530             nv = (args) ?
8531 #if LONG_DOUBLESIZE > DOUBLESIZE
8532                 intsize == 'q' ?
8533                     va_arg(*args, long double) :
8534                     va_arg(*args, double)
8535 #else
8536                     va_arg(*args, double)
8537 #endif
8538                 : SvNVx(argsv);
8539
8540             need = 0;
8541             if (c != 'e' && c != 'E') {
8542                 i = PERL_INT_MIN;
8543                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8544                    will cast our (long double) to (double) */
8545                 (void)Perl_frexp(nv, &i);
8546                 if (i == PERL_INT_MIN)
8547                     Perl_die(aTHX_ "panic: frexp");
8548                 if (i > 0)
8549                     need = BIT_DIGITS(i);
8550             }
8551             need += has_precis ? precis : 6; /* known default */
8552
8553             if (need < width)
8554                 need = width;
8555
8556 #ifdef HAS_LDBL_SPRINTF_BUG
8557             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8558                with sfio - Allen <allens@cpan.org> */
8559
8560 #  ifdef DBL_MAX
8561 #    define MY_DBL_MAX DBL_MAX
8562 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8563 #    if DOUBLESIZE >= 8
8564 #      define MY_DBL_MAX 1.7976931348623157E+308L
8565 #    else
8566 #      define MY_DBL_MAX 3.40282347E+38L
8567 #    endif
8568 #  endif
8569
8570 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8571 #    define MY_DBL_MAX_BUG 1L
8572 #  else
8573 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8574 #  endif
8575
8576 #  ifdef DBL_MIN
8577 #    define MY_DBL_MIN DBL_MIN
8578 #  else  /* XXX guessing! -Allen */
8579 #    if DOUBLESIZE >= 8
8580 #      define MY_DBL_MIN 2.2250738585072014E-308L
8581 #    else
8582 #      define MY_DBL_MIN 1.17549435E-38L
8583 #    endif
8584 #  endif
8585
8586             if ((intsize == 'q') && (c == 'f') &&
8587                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8588                 (need < DBL_DIG)) {
8589                 /* it's going to be short enough that
8590                  * long double precision is not needed */
8591
8592                 if ((nv <= 0L) && (nv >= -0L))
8593                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8594                 else {
8595                     /* would use Perl_fp_class as a double-check but not
8596                      * functional on IRIX - see perl.h comments */
8597
8598                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8599                         /* It's within the range that a double can represent */
8600 #if defined(DBL_MAX) && !defined(DBL_MIN)
8601                         if ((nv >= ((long double)1/DBL_MAX)) ||
8602                             (nv <= (-(long double)1/DBL_MAX)))
8603 #endif
8604                         fix_ldbl_sprintf_bug = TRUE;
8605                     }
8606                 }
8607                 if (fix_ldbl_sprintf_bug == TRUE) {
8608                     double temp;
8609
8610                     intsize = 0;
8611                     temp = (double)nv;
8612                     nv = (NV)temp;
8613                 }
8614             }
8615
8616 #  undef MY_DBL_MAX
8617 #  undef MY_DBL_MAX_BUG
8618 #  undef MY_DBL_MIN
8619
8620 #endif /* HAS_LDBL_SPRINTF_BUG */
8621
8622             need += 20; /* fudge factor */
8623             if (PL_efloatsize < need) {
8624                 Safefree(PL_efloatbuf);
8625                 PL_efloatsize = need + 20; /* more fudge */
8626                 Newx(PL_efloatbuf, PL_efloatsize, char);
8627                 PL_efloatbuf[0] = '\0';
8628             }
8629
8630             if ( !(width || left || plus || alt) && fill != '0'
8631                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8632                 /* See earlier comment about buggy Gconvert when digits,
8633                    aka precis is 0  */
8634                 if ( c == 'g' && precis) {
8635                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8636                     /* May return an empty string for digits==0 */
8637                     if (*PL_efloatbuf) {
8638                         elen = strlen(PL_efloatbuf);
8639                         goto float_converted;
8640                     }
8641                 } else if ( c == 'f' && !precis) {
8642                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8643                         break;
8644                 }
8645             }
8646             {
8647                 char *ptr = ebuf + sizeof ebuf;
8648                 *--ptr = '\0';
8649                 *--ptr = c;
8650                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8651 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8652                 if (intsize == 'q') {
8653                     /* Copy the one or more characters in a long double
8654                      * format before the 'base' ([efgEFG]) character to
8655                      * the format string. */
8656                     static char const prifldbl[] = PERL_PRIfldbl;
8657                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8658                     while (p >= prifldbl) { *--ptr = *p--; }
8659                 }
8660 #endif
8661                 if (has_precis) {
8662                     base = precis;
8663                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8664                     *--ptr = '.';
8665                 }
8666                 if (width) {
8667                     base = width;
8668                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8669                 }
8670                 if (fill == '0')
8671                     *--ptr = fill;
8672                 if (left)
8673                     *--ptr = '-';
8674                 if (plus)
8675                     *--ptr = plus;
8676                 if (alt)
8677                     *--ptr = '#';
8678                 *--ptr = '%';
8679
8680                 /* No taint.  Otherwise we are in the strange situation
8681                  * where printf() taints but print($float) doesn't.
8682                  * --jhi */
8683 #if defined(HAS_LONG_DOUBLE)
8684                 elen = ((intsize == 'q')
8685                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8686                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8687 #else
8688                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8689 #endif
8690             }
8691         float_converted:
8692             eptr = PL_efloatbuf;
8693             break;
8694
8695             /* SPECIAL */
8696
8697         case 'n':
8698             if (vectorize)
8699                 goto unknown;
8700             i = SvCUR(sv) - origlen;
8701             if (args) {
8702                 switch (intsize) {
8703                 case 'h':       *(va_arg(*args, short*)) = i; break;
8704                 default:        *(va_arg(*args, int*)) = i; break;
8705                 case 'l':       *(va_arg(*args, long*)) = i; break;
8706                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8707 #ifdef HAS_QUAD
8708                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8709 #endif
8710                 }
8711             }
8712             else
8713                 sv_setuv_mg(argsv, (UV)i);
8714             continue;   /* not "break" */
8715
8716             /* UNKNOWN */
8717
8718         default:
8719       unknown:
8720             if (!args
8721                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8722                 && ckWARN(WARN_PRINTF))
8723             {
8724                 SV * const msg = sv_newmortal();
8725                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8726                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8727                 if (c) {
8728                     if (isPRINT(c))
8729                         Perl_sv_catpvf(aTHX_ msg,
8730                                        "\"%%%c\"", c & 0xFF);
8731                     else
8732                         Perl_sv_catpvf(aTHX_ msg,
8733                                        "\"%%\\%03"UVof"\"",
8734                                        (UV)c & 0xFF);
8735                 } else
8736                     sv_catpvs(msg, "end of string");
8737                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8738             }
8739
8740             /* output mangled stuff ... */
8741             if (c == '\0')
8742                 --q;
8743             eptr = p;
8744             elen = q - p;
8745
8746             /* ... right here, because formatting flags should not apply */
8747             SvGROW(sv, SvCUR(sv) + elen + 1);
8748             p = SvEND(sv);
8749             Copy(eptr, p, elen, char);
8750             p += elen;
8751             *p = '\0';
8752             SvCUR_set(sv, p - SvPVX_const(sv));
8753             svix = osvix;
8754             continue;   /* not "break" */
8755         }
8756
8757         /* calculate width before utf8_upgrade changes it */
8758         have = esignlen + zeros + elen;
8759         if (have < zeros)
8760             Perl_croak_nocontext(PL_memory_wrap);
8761
8762         if (is_utf8 != has_utf8) {
8763              if (is_utf8) {
8764                   if (SvCUR(sv))
8765                        sv_utf8_upgrade(sv);
8766              }
8767              else {
8768                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8769                   sv_utf8_upgrade(nsv);
8770                   eptr = SvPVX_const(nsv);
8771                   elen = SvCUR(nsv);
8772              }
8773              SvGROW(sv, SvCUR(sv) + elen + 1);
8774              p = SvEND(sv);
8775              *p = '\0';
8776         }
8777
8778         need = (have > width ? have : width);
8779         gap = need - have;
8780
8781         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8782             Perl_croak_nocontext(PL_memory_wrap);
8783         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8784         p = SvEND(sv);
8785         if (esignlen && fill == '0') {
8786             int i;
8787             for (i = 0; i < (int)esignlen; i++)
8788                 *p++ = esignbuf[i];
8789         }
8790         if (gap && !left) {
8791             memset(p, fill, gap);
8792             p += gap;
8793         }
8794         if (esignlen && fill != '0') {
8795             int i;
8796             for (i = 0; i < (int)esignlen; i++)
8797                 *p++ = esignbuf[i];
8798         }
8799         if (zeros) {
8800             int i;
8801             for (i = zeros; i; i--)
8802                 *p++ = '0';
8803         }
8804         if (elen) {
8805             Copy(eptr, p, elen, char);
8806             p += elen;
8807         }
8808         if (gap && left) {
8809             memset(p, ' ', gap);
8810             p += gap;
8811         }
8812         if (vectorize) {
8813             if (veclen) {
8814                 Copy(dotstr, p, dotstrlen, char);
8815                 p += dotstrlen;
8816             }
8817             else
8818                 vectorize = FALSE;              /* done iterating over vecstr */
8819         }
8820         if (is_utf8)
8821             has_utf8 = TRUE;
8822         if (has_utf8)
8823             SvUTF8_on(sv);
8824         *p = '\0';
8825         SvCUR_set(sv, p - SvPVX_const(sv));
8826         if (vectorize) {
8827             esignlen = 0;
8828             goto vector;
8829         }
8830     }
8831 }
8832
8833 /* =========================================================================
8834
8835 =head1 Cloning an interpreter
8836
8837 All the macros and functions in this section are for the private use of
8838 the main function, perl_clone().
8839
8840 The foo_dup() functions make an exact copy of an existing foo thinngy.
8841 During the course of a cloning, a hash table is used to map old addresses
8842 to new addresses. The table is created and manipulated with the
8843 ptr_table_* functions.
8844
8845 =cut
8846
8847 ============================================================================*/
8848
8849
8850 #if defined(USE_ITHREADS)
8851
8852 #ifndef GpREFCNT_inc
8853 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8854 #endif
8855
8856
8857 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8858 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8859 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8860 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8861 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8862 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8863 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8864 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8865 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8866 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8867 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8868 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8869 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8870
8871
8872 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8873    regcomp.c. AMS 20010712 */
8874
8875 REGEXP *
8876 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8877 {
8878     dVAR;
8879     REGEXP *ret;
8880     int i, len, npar;
8881     struct reg_substr_datum *s;
8882
8883     if (!r)
8884         return (REGEXP *)NULL;
8885
8886     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8887         return ret;
8888
8889     len = r->offsets[0];
8890     npar = r->nparens+1;
8891
8892     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8893     Copy(r->program, ret->program, len+1, regnode);
8894
8895     Newx(ret->startp, npar, I32);
8896     Copy(r->startp, ret->startp, npar, I32);
8897     Newx(ret->endp, npar, I32);
8898     Copy(r->startp, ret->startp, npar, I32);
8899
8900     Newx(ret->substrs, 1, struct reg_substr_data);
8901     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
8902         s->min_offset = r->substrs->data[i].min_offset;
8903         s->max_offset = r->substrs->data[i].max_offset;
8904         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
8905         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
8906     }
8907
8908     ret->regstclass = NULL;
8909     if (r->data) {
8910         struct reg_data *d;
8911         const int count = r->data->count;
8912         int i;
8913
8914         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
8915                 char, struct reg_data);
8916         Newx(d->what, count, U8);
8917
8918         d->count = count;
8919         for (i = 0; i < count; i++) {
8920             d->what[i] = r->data->what[i];
8921             switch (d->what[i]) {
8922                 /* legal options are one of: sfpont
8923                    see also regcomp.h and pregfree() */
8924             case 's':
8925                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
8926                 break;
8927             case 'p':
8928                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
8929                 break;
8930             case 'f':
8931                 /* This is cheating. */
8932                 Newx(d->data[i], 1, struct regnode_charclass_class);
8933                 StructCopy(r->data->data[i], d->data[i],
8934                             struct regnode_charclass_class);
8935                 ret->regstclass = (regnode*)d->data[i];
8936                 break;
8937             case 'o':
8938                 /* Compiled op trees are readonly, and can thus be
8939                    shared without duplication. */
8940                 OP_REFCNT_LOCK;
8941                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
8942                 OP_REFCNT_UNLOCK;
8943                 break;
8944             case 'n':
8945                 d->data[i] = r->data->data[i];
8946                 break;
8947             case 't':
8948                 d->data[i] = r->data->data[i];
8949                 OP_REFCNT_LOCK;
8950                 ((reg_trie_data*)d->data[i])->refcount++;
8951                 OP_REFCNT_UNLOCK;
8952                 break;
8953             default:
8954                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
8955             }
8956         }
8957
8958         ret->data = d;
8959     }
8960     else
8961         ret->data = NULL;
8962
8963     Newx(ret->offsets, 2*len+1, U32);
8964     Copy(r->offsets, ret->offsets, 2*len+1, U32);
8965
8966     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
8967     ret->refcnt         = r->refcnt;
8968     ret->minlen         = r->minlen;
8969     ret->prelen         = r->prelen;
8970     ret->nparens        = r->nparens;
8971     ret->lastparen      = r->lastparen;
8972     ret->lastcloseparen = r->lastcloseparen;
8973     ret->reganch        = r->reganch;
8974
8975     ret->sublen         = r->sublen;
8976
8977     if (RX_MATCH_COPIED(ret))
8978         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
8979     else
8980         ret->subbeg = Nullch;
8981 #ifdef PERL_OLD_COPY_ON_WRITE
8982     ret->saved_copy = Nullsv;
8983 #endif
8984
8985     ptr_table_store(PL_ptr_table, r, ret);
8986     return ret;
8987 }
8988
8989 /* duplicate a file handle */
8990
8991 PerlIO *
8992 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
8993 {
8994     PerlIO *ret;
8995
8996     PERL_UNUSED_ARG(type);
8997
8998     if (!fp)
8999         return (PerlIO*)NULL;
9000
9001     /* look for it in the table first */
9002     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
9003     if (ret)
9004         return ret;
9005
9006     /* create anew and remember what it is */
9007     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
9008     ptr_table_store(PL_ptr_table, fp, ret);
9009     return ret;
9010 }
9011
9012 /* duplicate a directory handle */
9013
9014 DIR *
9015 Perl_dirp_dup(pTHX_ DIR *dp)
9016 {
9017     if (!dp)
9018         return (DIR*)NULL;
9019     /* XXX TODO */
9020     return dp;
9021 }
9022
9023 /* duplicate a typeglob */
9024
9025 GP *
9026 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
9027 {
9028     GP *ret;
9029     if (!gp)
9030         return (GP*)NULL;
9031     /* look for it in the table first */
9032     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
9033     if (ret)
9034         return ret;
9035
9036     /* create anew and remember what it is */
9037     Newxz(ret, 1, GP);
9038     ptr_table_store(PL_ptr_table, gp, ret);
9039
9040     /* clone */
9041     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
9042     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
9043     ret->gp_io          = io_dup_inc(gp->gp_io, param);
9044     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
9045     ret->gp_av          = av_dup_inc(gp->gp_av, param);
9046     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
9047     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
9048     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
9049     ret->gp_cvgen       = gp->gp_cvgen;
9050     ret->gp_line        = gp->gp_line;
9051     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
9052     return ret;
9053 }
9054
9055 /* duplicate a chain of magic */
9056
9057 MAGIC *
9058 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
9059 {
9060     MAGIC *mgprev = (MAGIC*)NULL;
9061     MAGIC *mgret;
9062     if (!mg)
9063         return (MAGIC*)NULL;
9064     /* look for it in the table first */
9065     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
9066     if (mgret)
9067         return mgret;
9068
9069     for (; mg; mg = mg->mg_moremagic) {
9070         MAGIC *nmg;
9071         Newxz(nmg, 1, MAGIC);
9072         if (mgprev)
9073             mgprev->mg_moremagic = nmg;
9074         else
9075             mgret = nmg;
9076         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
9077         nmg->mg_private = mg->mg_private;
9078         nmg->mg_type    = mg->mg_type;
9079         nmg->mg_flags   = mg->mg_flags;
9080         if (mg->mg_type == PERL_MAGIC_qr) {
9081             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
9082         }
9083         else if(mg->mg_type == PERL_MAGIC_backref) {
9084             /* The backref AV has its reference count deliberately bumped by
9085                1.  */
9086             nmg->mg_obj = SvREFCNT_inc(av_dup_inc((AV*) mg->mg_obj, param));
9087         }
9088         else if (mg->mg_type == PERL_MAGIC_symtab) {
9089             nmg->mg_obj = mg->mg_obj;
9090         }
9091         else {
9092             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9093                               ? sv_dup_inc(mg->mg_obj, param)
9094                               : sv_dup(mg->mg_obj, param);
9095         }
9096         nmg->mg_len     = mg->mg_len;
9097         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9098         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9099             if (mg->mg_len > 0) {
9100                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9101                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9102                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9103                 {
9104                     const AMT * const amtp = (AMT*)mg->mg_ptr;
9105                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9106                     I32 i;
9107                     for (i = 1; i < NofAMmeth; i++) {
9108                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9109                     }
9110                 }
9111             }
9112             else if (mg->mg_len == HEf_SVKEY)
9113                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9114         }
9115         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9116             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9117         }
9118         mgprev = nmg;
9119     }
9120     return mgret;
9121 }
9122
9123 /* create a new pointer-mapping table */
9124
9125 PTR_TBL_t *
9126 Perl_ptr_table_new(pTHX)
9127 {
9128     PTR_TBL_t *tbl;
9129     Newxz(tbl, 1, PTR_TBL_t);
9130     tbl->tbl_max        = 511;
9131     tbl->tbl_items      = 0;
9132     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9133     return tbl;
9134 }
9135
9136 #define PTR_TABLE_HASH(ptr) \
9137   ((PTR2UV(ptr) >> 3) ^ (PTR2UV(ptr) >> (3 + 7)) ^ (PTR2UV(ptr) >> (3 + 17)))
9138
9139 /* 
9140    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9141    following define) and at call to new_body_inline made below in 
9142    Perl_ptr_table_store()
9143  */
9144
9145 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9146
9147 /* map an existing pointer using a table */
9148
9149 STATIC PTR_TBL_ENT_t *
9150 S_ptr_table_find(pTHX_ PTR_TBL_t *tbl, const void *sv) {
9151     PTR_TBL_ENT_t *tblent;
9152     const UV hash = PTR_TABLE_HASH(sv);
9153     assert(tbl);
9154     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9155     for (; tblent; tblent = tblent->next) {
9156         if (tblent->oldval == sv)
9157             return tblent;
9158     }
9159     return 0;
9160 }
9161
9162 void *
9163 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9164 {
9165     PTR_TBL_ENT_t const *const tblent = S_ptr_table_find(aTHX_ tbl, sv);
9166     return tblent ? tblent->newval : (void *) 0;
9167 }
9168
9169 /* add a new entry to a pointer-mapping table */
9170
9171 void
9172 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9173 {
9174     PTR_TBL_ENT_t *tblent = S_ptr_table_find(aTHX_ tbl, oldsv);
9175
9176     if (tblent) {
9177         tblent->newval = newsv;
9178     } else {
9179         const UV entry = PTR_TABLE_HASH(oldsv) & tbl->tbl_max;
9180
9181         new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9182         tblent->oldval = oldsv;
9183         tblent->newval = newsv;
9184         tblent->next = tbl->tbl_ary[entry];
9185         tbl->tbl_ary[entry] = tblent;
9186         tbl->tbl_items++;
9187         if (tblent->next && tbl->tbl_items > tbl->tbl_max)
9188             ptr_table_split(tbl);
9189     }
9190 }
9191
9192 /* double the hash bucket size of an existing ptr table */
9193
9194 void
9195 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9196 {
9197     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9198     const UV oldsize = tbl->tbl_max + 1;
9199     UV newsize = oldsize * 2;
9200     UV i;
9201
9202     Renew(ary, newsize, PTR_TBL_ENT_t*);
9203     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9204     tbl->tbl_max = --newsize;
9205     tbl->tbl_ary = ary;
9206     for (i=0; i < oldsize; i++, ary++) {
9207         PTR_TBL_ENT_t **curentp, **entp, *ent;
9208         if (!*ary)
9209             continue;
9210         curentp = ary + oldsize;
9211         for (entp = ary, ent = *ary; ent; ent = *entp) {
9212             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9213                 *entp = ent->next;
9214                 ent->next = *curentp;
9215                 *curentp = ent;
9216                 continue;
9217             }
9218             else
9219                 entp = &ent->next;
9220         }
9221     }
9222 }
9223
9224 /* remove all the entries from a ptr table */
9225
9226 void
9227 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9228 {
9229     if (tbl && tbl->tbl_items) {
9230         register PTR_TBL_ENT_t * const * const array = tbl->tbl_ary;
9231         UV riter = tbl->tbl_max;
9232
9233         do {
9234             PTR_TBL_ENT_t *entry = array[riter];
9235
9236             while (entry) {
9237                 PTR_TBL_ENT_t * const oentry = entry;
9238                 entry = entry->next;
9239                 del_pte(oentry);
9240             }
9241         } while (riter--);
9242
9243         tbl->tbl_items = 0;
9244     }
9245 }
9246
9247 /* clear and free a ptr table */
9248
9249 void
9250 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9251 {
9252     if (!tbl) {
9253         return;
9254     }
9255     ptr_table_clear(tbl);
9256     Safefree(tbl->tbl_ary);
9257     Safefree(tbl);
9258 }
9259
9260
9261 void
9262 Perl_rvpv_dup(pTHX_ SV *dstr, const SV *sstr, CLONE_PARAMS* param)
9263 {
9264     if (SvROK(sstr)) {
9265         SvRV_set(dstr, SvWEAKREF(sstr)
9266                        ? sv_dup(SvRV(sstr), param)
9267                        : sv_dup_inc(SvRV(sstr), param));
9268
9269     }
9270     else if (SvPVX_const(sstr)) {
9271         /* Has something there */
9272         if (SvLEN(sstr)) {
9273             /* Normal PV - clone whole allocated space */
9274             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9275             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9276                 /* Not that normal - actually sstr is copy on write.
9277                    But we are a true, independant SV, so:  */
9278                 SvREADONLY_off(dstr);
9279                 SvFAKE_off(dstr);
9280             }
9281         }
9282         else {
9283             /* Special case - not normally malloced for some reason */
9284             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9285                 /* A "shared" PV - clone it as "shared" PV */
9286                 SvPV_set(dstr,
9287                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9288                                          param)));
9289             }
9290             else {
9291                 /* Some other special case - random pointer */
9292                 SvPV_set(dstr, SvPVX(sstr));            
9293             }
9294         }
9295     }
9296     else {
9297         /* Copy the Null */
9298         if (SvTYPE(dstr) == SVt_RV)
9299             SvRV_set(dstr, NULL);
9300         else
9301             SvPV_set(dstr, 0);
9302     }
9303 }
9304
9305 /* duplicate an SV of any type (including AV, HV etc) */
9306
9307 SV *
9308 Perl_sv_dup(pTHX_ const SV *sstr, CLONE_PARAMS* param)
9309 {
9310     dVAR;
9311     SV *dstr;
9312
9313     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9314         return Nullsv;
9315     /* look for it in the table first */
9316     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9317     if (dstr)
9318         return dstr;
9319
9320     if(param->flags & CLONEf_JOIN_IN) {
9321         /** We are joining here so we don't want do clone
9322             something that is bad **/
9323         if (SvTYPE(sstr) == SVt_PVHV) {
9324             const char * const hvname = HvNAME_get(sstr);
9325             if (hvname)
9326                 /** don't clone stashes if they already exist **/
9327                 return (SV*)gv_stashpv(hvname,0);
9328         }
9329     }
9330
9331     /* create anew and remember what it is */
9332     new_SV(dstr);
9333
9334 #ifdef DEBUG_LEAKING_SCALARS
9335     dstr->sv_debug_optype = sstr->sv_debug_optype;
9336     dstr->sv_debug_line = sstr->sv_debug_line;
9337     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9338     dstr->sv_debug_cloned = 1;
9339     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9340 #endif
9341
9342     ptr_table_store(PL_ptr_table, sstr, dstr);
9343
9344     /* clone */
9345     SvFLAGS(dstr)       = SvFLAGS(sstr);
9346     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9347     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9348
9349 #ifdef DEBUGGING
9350     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9351         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9352                       PL_watch_pvx, SvPVX_const(sstr));
9353 #endif
9354
9355     /* don't clone objects whose class has asked us not to */
9356     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9357         SvFLAGS(dstr) &= ~SVTYPEMASK;
9358         SvOBJECT_off(dstr);
9359         return dstr;
9360     }
9361
9362     switch (SvTYPE(sstr)) {
9363     case SVt_NULL:
9364         SvANY(dstr)     = NULL;
9365         break;
9366     case SVt_IV:
9367         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9368         SvIV_set(dstr, SvIVX(sstr));
9369         break;
9370     case SVt_NV:
9371         SvANY(dstr)     = new_XNV();
9372         SvNV_set(dstr, SvNVX(sstr));
9373         break;
9374     case SVt_RV:
9375         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9376         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9377         break;
9378     default:
9379         {
9380             /* These are all the types that need complex bodies allocating.  */
9381             void *new_body;
9382             const svtype sv_type = SvTYPE(sstr);
9383             const struct body_details *const sv_type_details
9384                 = bodies_by_type + sv_type;
9385
9386             switch (sv_type) {
9387             default:
9388                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9389                            (IV)SvTYPE(sstr));
9390                 break;
9391
9392             case SVt_PVGV:
9393                 if (GvUNIQUE((GV*)sstr)) {
9394                     /* Do sharing here, and fall through */
9395                 }
9396             case SVt_PVIO:
9397             case SVt_PVFM:
9398             case SVt_PVHV:
9399             case SVt_PVAV:
9400             case SVt_PVBM:
9401             case SVt_PVCV:
9402             case SVt_PVLV:
9403             case SVt_PVMG:
9404             case SVt_PVNV:
9405             case SVt_PVIV:
9406             case SVt_PV:
9407                 assert(sv_type_details->size);
9408                 if (sv_type_details->arena) {
9409                     new_body_inline(new_body, sv_type_details->size, sv_type);
9410                     new_body
9411                         = (void*)((char*)new_body - sv_type_details->offset);
9412                 } else {
9413                     new_body = new_NOARENA(sv_type_details);
9414                 }
9415             }
9416             assert(new_body);
9417             SvANY(dstr) = new_body;
9418
9419 #ifndef PURIFY
9420             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9421                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9422                  sv_type_details->copy, char);
9423 #else
9424             Copy(((char*)SvANY(sstr)),
9425                  ((char*)SvANY(dstr)),
9426                  sv_type_details->size + sv_type_details->offset, char);
9427 #endif
9428
9429             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9430                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9431
9432             /* The Copy above means that all the source (unduplicated) pointers
9433                are now in the destination.  We can check the flags and the
9434                pointers in either, but it's possible that there's less cache
9435                missing by always going for the destination.
9436                FIXME - instrument and check that assumption  */
9437             if (sv_type >= SVt_PVMG) {
9438                 if (SvMAGIC(dstr))
9439                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9440                 if (SvSTASH(dstr))
9441                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9442             }
9443
9444             /* The cast silences a GCC warning about unhandled types.  */
9445             switch ((int)sv_type) {
9446             case SVt_PV:
9447                 break;
9448             case SVt_PVIV:
9449                 break;
9450             case SVt_PVNV:
9451                 break;
9452             case SVt_PVMG:
9453                 break;
9454             case SVt_PVBM:
9455                 break;
9456             case SVt_PVLV:
9457                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9458                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9459                     LvTARG(dstr) = dstr;
9460                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9461                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9462                 else
9463                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9464                 break;
9465             case SVt_PVGV:
9466                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9467                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9468                 /* Don't call sv_add_backref here as it's going to be created
9469                    as part of the magic cloning of the symbol table.  */
9470                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9471                 (void)GpREFCNT_inc(GvGP(dstr));
9472                 break;
9473             case SVt_PVIO:
9474                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9475                 if (IoOFP(dstr) == IoIFP(sstr))
9476                     IoOFP(dstr) = IoIFP(dstr);
9477                 else
9478                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9479                 /* PL_rsfp_filters entries have fake IoDIRP() */
9480                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9481                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9482                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9483                     /* I have no idea why fake dirp (rsfps)
9484                        should be treated differently but otherwise
9485                        we end up with leaks -- sky*/
9486                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9487                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9488                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9489                 } else {
9490                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9491                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9492                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9493                 }
9494                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9495                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9496                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9497                 break;
9498             case SVt_PVAV:
9499                 if (AvARRAY((AV*)sstr)) {
9500                     SV **dst_ary, **src_ary;
9501                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9502
9503                     src_ary = AvARRAY((AV*)sstr);
9504                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9505                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9506                     SvPV_set(dstr, (char*)dst_ary);
9507                     AvALLOC((AV*)dstr) = dst_ary;
9508                     if (AvREAL((AV*)sstr)) {
9509                         while (items-- > 0)
9510                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9511                     }
9512                     else {
9513                         while (items-- > 0)
9514                             *dst_ary++ = sv_dup(*src_ary++, param);
9515                     }
9516                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9517                     while (items-- > 0) {
9518                         *dst_ary++ = &PL_sv_undef;
9519                     }
9520                 }
9521                 else {
9522                     SvPV_set(dstr, Nullch);
9523                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9524                 }
9525                 break;
9526             case SVt_PVHV:
9527                 {
9528                     HEK *hvname = NULL;
9529
9530                     if (HvARRAY((HV*)sstr)) {
9531                         STRLEN i = 0;
9532                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9533                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9534                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9535                         char *darray;
9536                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9537                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9538                             char);
9539                         HvARRAY(dstr) = (HE**)darray;
9540                         while (i <= sxhv->xhv_max) {
9541                             const HE *source = HvARRAY(sstr)[i];
9542                             HvARRAY(dstr)[i] = source
9543                                 ? he_dup(source, sharekeys, param) : 0;
9544                             ++i;
9545                         }
9546                         if (SvOOK(sstr)) {
9547                             struct xpvhv_aux * const saux = HvAUX(sstr);
9548                             struct xpvhv_aux * const daux = HvAUX(dstr);
9549                             /* This flag isn't copied.  */
9550                             /* SvOOK_on(hv) attacks the IV flags.  */
9551                             SvFLAGS(dstr) |= SVf_OOK;
9552
9553                             hvname = saux->xhv_name;
9554                             daux->xhv_name
9555                                 = hvname ? hek_dup(hvname, param) : hvname;
9556
9557                             daux->xhv_riter = saux->xhv_riter;
9558                             daux->xhv_eiter = saux->xhv_eiter
9559                                 ? he_dup(saux->xhv_eiter,
9560                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9561                             daux->xhv_backreferences = saux->xhv_backreferences
9562                                 ? (AV*) SvREFCNT_inc(
9563                                                      sv_dup((SV*)saux->
9564                                                             xhv_backreferences,
9565                                                             param))
9566                                 : 0;
9567                         }
9568                     }
9569                     else {
9570                         SvPV_set(dstr, Nullch);
9571                     }
9572                     /* Record stashes for possible cloning in Perl_clone(). */
9573                     if(hvname)
9574                         av_push(param->stashes, dstr);
9575                 }
9576                 break;
9577             case SVt_PVFM:
9578             case SVt_PVCV:
9579                 /* NOTE: not refcounted */
9580                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9581                 OP_REFCNT_LOCK;
9582                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9583                 OP_REFCNT_UNLOCK;
9584                 if (CvCONST(dstr)) {
9585                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9586                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9587                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9588                 }
9589                 /* don't dup if copying back - CvGV isn't refcounted, so the
9590                  * duped GV may never be freed. A bit of a hack! DAPM */
9591                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9592                     Nullgv : gv_dup(CvGV(dstr), param) ;
9593                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9594                     CvDEPTH(dstr) = 0;
9595                 }
9596                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9597                 CvOUTSIDE(dstr) =
9598                     CvWEAKOUTSIDE(sstr)
9599                     ? cv_dup(    CvOUTSIDE(dstr), param)
9600                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9601                 if (!CvXSUB(dstr))
9602                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9603                 break;
9604             }
9605         }
9606     }
9607
9608     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9609         ++PL_sv_objcount;
9610
9611     return dstr;
9612  }
9613
9614 /* duplicate a context */
9615
9616 PERL_CONTEXT *
9617 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9618 {
9619     PERL_CONTEXT *ncxs;
9620
9621     if (!cxs)
9622         return (PERL_CONTEXT*)NULL;
9623
9624     /* look for it in the table first */
9625     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9626     if (ncxs)
9627         return ncxs;
9628
9629     /* create anew and remember what it is */
9630     Newxz(ncxs, max + 1, PERL_CONTEXT);
9631     ptr_table_store(PL_ptr_table, cxs, ncxs);
9632
9633     while (ix >= 0) {
9634         PERL_CONTEXT * const cx = &cxs[ix];
9635         PERL_CONTEXT * const ncx = &ncxs[ix];
9636         ncx->cx_type    = cx->cx_type;
9637         if (CxTYPE(cx) == CXt_SUBST) {
9638             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9639         }
9640         else {
9641             ncx->blk_oldsp      = cx->blk_oldsp;
9642             ncx->blk_oldcop     = cx->blk_oldcop;
9643             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9644             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9645             ncx->blk_oldpm      = cx->blk_oldpm;
9646             ncx->blk_gimme      = cx->blk_gimme;
9647             switch (CxTYPE(cx)) {
9648             case CXt_SUB:
9649                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9650                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9651                                            : cv_dup(cx->blk_sub.cv,param));
9652                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9653                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9654                                            : NULL);
9655                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9656                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9657                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9658                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9659                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9660                 break;
9661             case CXt_EVAL:
9662                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9663                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9664                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9665                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9666                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9667                 ncx->blk_eval.retop = cx->blk_eval.retop;
9668                 break;
9669             case CXt_LOOP:
9670                 ncx->blk_loop.label     = cx->blk_loop.label;
9671                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9672                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9673                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9674                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9675                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9676                                            ? cx->blk_loop.iterdata
9677                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9678                 ncx->blk_loop.oldcomppad
9679                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9680                                             cx->blk_loop.oldcomppad);
9681                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9682                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9683                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9684                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9685                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9686                 break;
9687             case CXt_FORMAT:
9688                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9689                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9690                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9691                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9692                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9693                 break;
9694             case CXt_BLOCK:
9695             case CXt_NULL:
9696                 break;
9697             }
9698         }
9699         --ix;
9700     }
9701     return ncxs;
9702 }
9703
9704 /* duplicate a stack info structure */
9705
9706 PERL_SI *
9707 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9708 {
9709     PERL_SI *nsi;
9710
9711     if (!si)
9712         return (PERL_SI*)NULL;
9713
9714     /* look for it in the table first */
9715     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9716     if (nsi)
9717         return nsi;
9718
9719     /* create anew and remember what it is */
9720     Newxz(nsi, 1, PERL_SI);
9721     ptr_table_store(PL_ptr_table, si, nsi);
9722
9723     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9724     nsi->si_cxix        = si->si_cxix;
9725     nsi->si_cxmax       = si->si_cxmax;
9726     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9727     nsi->si_type        = si->si_type;
9728     nsi->si_prev        = si_dup(si->si_prev, param);
9729     nsi->si_next        = si_dup(si->si_next, param);
9730     nsi->si_markoff     = si->si_markoff;
9731
9732     return nsi;
9733 }
9734
9735 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9736 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9737 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9738 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9739 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9740 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9741 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9742 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9743 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9744 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9745 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9746 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9747 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9748 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9749
9750 /* XXXXX todo */
9751 #define pv_dup_inc(p)   SAVEPV(p)
9752 #define pv_dup(p)       SAVEPV(p)
9753 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9754
9755 /* map any object to the new equivent - either something in the
9756  * ptr table, or something in the interpreter structure
9757  */
9758
9759 void *
9760 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9761 {
9762     void *ret;
9763
9764     if (!v)
9765         return (void*)NULL;
9766
9767     /* look for it in the table first */
9768     ret = ptr_table_fetch(PL_ptr_table, v);
9769     if (ret)
9770         return ret;
9771
9772     /* see if it is part of the interpreter structure */
9773     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9774         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9775     else {
9776         ret = v;
9777     }
9778
9779     return ret;
9780 }
9781
9782 /* duplicate the save stack */
9783
9784 ANY *
9785 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9786 {
9787     ANY * const ss      = proto_perl->Tsavestack;
9788     const I32 max       = proto_perl->Tsavestack_max;
9789     I32 ix              = proto_perl->Tsavestack_ix;
9790     ANY *nss;
9791     SV *sv;
9792     GV *gv;
9793     AV *av;
9794     HV *hv;
9795     void* ptr;
9796     int intval;
9797     long longval;
9798     GP *gp;
9799     IV iv;
9800     char *c = NULL;
9801     void (*dptr) (void*);
9802     void (*dxptr) (pTHX_ void*);
9803
9804     Newxz(nss, max, ANY);
9805
9806     while (ix > 0) {
9807         I32 i = POPINT(ss,ix);
9808         TOPINT(nss,ix) = i;
9809         switch (i) {
9810         case SAVEt_ITEM:                        /* normal string */
9811             sv = (SV*)POPPTR(ss,ix);
9812             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9813             sv = (SV*)POPPTR(ss,ix);
9814             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9815             break;
9816         case SAVEt_SV:                          /* scalar reference */
9817             sv = (SV*)POPPTR(ss,ix);
9818             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9819             gv = (GV*)POPPTR(ss,ix);
9820             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9821             break;
9822         case SAVEt_GENERIC_PVREF:               /* generic char* */
9823             c = (char*)POPPTR(ss,ix);
9824             TOPPTR(nss,ix) = pv_dup(c);
9825             ptr = POPPTR(ss,ix);
9826             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9827             break;
9828         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9829             c = (char*)POPPTR(ss,ix);
9830             TOPPTR(nss,ix) = savesharedpv(c);
9831             ptr = POPPTR(ss,ix);
9832             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9833             break;
9834         case SAVEt_GENERIC_SVREF:               /* generic sv */
9835         case SAVEt_SVREF:                       /* scalar reference */
9836             sv = (SV*)POPPTR(ss,ix);
9837             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9838             ptr = POPPTR(ss,ix);
9839             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9840             break;
9841         case SAVEt_AV:                          /* array reference */
9842             av = (AV*)POPPTR(ss,ix);
9843             TOPPTR(nss,ix) = av_dup_inc(av, param);
9844             gv = (GV*)POPPTR(ss,ix);
9845             TOPPTR(nss,ix) = gv_dup(gv, param);
9846             break;
9847         case SAVEt_HV:                          /* hash reference */
9848             hv = (HV*)POPPTR(ss,ix);
9849             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9850             gv = (GV*)POPPTR(ss,ix);
9851             TOPPTR(nss,ix) = gv_dup(gv, param);
9852             break;
9853         case SAVEt_INT:                         /* int reference */
9854             ptr = POPPTR(ss,ix);
9855             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9856             intval = (int)POPINT(ss,ix);
9857             TOPINT(nss,ix) = intval;
9858             break;
9859         case SAVEt_LONG:                        /* long reference */
9860             ptr = POPPTR(ss,ix);
9861             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9862             longval = (long)POPLONG(ss,ix);
9863             TOPLONG(nss,ix) = longval;
9864             break;
9865         case SAVEt_I32:                         /* I32 reference */
9866         case SAVEt_I16:                         /* I16 reference */
9867         case SAVEt_I8:                          /* I8 reference */
9868             ptr = POPPTR(ss,ix);
9869             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9870             i = POPINT(ss,ix);
9871             TOPINT(nss,ix) = i;
9872             break;
9873         case SAVEt_IV:                          /* IV reference */
9874             ptr = POPPTR(ss,ix);
9875             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9876             iv = POPIV(ss,ix);
9877             TOPIV(nss,ix) = iv;
9878             break;
9879         case SAVEt_SPTR:                        /* SV* reference */
9880             ptr = POPPTR(ss,ix);
9881             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9882             sv = (SV*)POPPTR(ss,ix);
9883             TOPPTR(nss,ix) = sv_dup(sv, param);
9884             break;
9885         case SAVEt_VPTR:                        /* random* reference */
9886             ptr = POPPTR(ss,ix);
9887             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9888             ptr = POPPTR(ss,ix);
9889             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9890             break;
9891         case SAVEt_PPTR:                        /* char* reference */
9892             ptr = POPPTR(ss,ix);
9893             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9894             c = (char*)POPPTR(ss,ix);
9895             TOPPTR(nss,ix) = pv_dup(c);
9896             break;
9897         case SAVEt_HPTR:                        /* HV* reference */
9898             ptr = POPPTR(ss,ix);
9899             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9900             hv = (HV*)POPPTR(ss,ix);
9901             TOPPTR(nss,ix) = hv_dup(hv, param);
9902             break;
9903         case SAVEt_APTR:                        /* AV* reference */
9904             ptr = POPPTR(ss,ix);
9905             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9906             av = (AV*)POPPTR(ss,ix);
9907             TOPPTR(nss,ix) = av_dup(av, param);
9908             break;
9909         case SAVEt_NSTAB:
9910             gv = (GV*)POPPTR(ss,ix);
9911             TOPPTR(nss,ix) = gv_dup(gv, param);
9912             break;
9913         case SAVEt_GP:                          /* scalar reference */
9914             gp = (GP*)POPPTR(ss,ix);
9915             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
9916             (void)GpREFCNT_inc(gp);
9917             gv = (GV*)POPPTR(ss,ix);
9918             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9919             c = (char*)POPPTR(ss,ix);
9920             TOPPTR(nss,ix) = pv_dup(c);
9921             iv = POPIV(ss,ix);
9922             TOPIV(nss,ix) = iv;
9923             iv = POPIV(ss,ix);
9924             TOPIV(nss,ix) = iv;
9925             break;
9926         case SAVEt_FREESV:
9927         case SAVEt_MORTALIZESV:
9928             sv = (SV*)POPPTR(ss,ix);
9929             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9930             break;
9931         case SAVEt_FREEOP:
9932             ptr = POPPTR(ss,ix);
9933             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
9934                 /* these are assumed to be refcounted properly */
9935                 OP *o;
9936                 switch (((OP*)ptr)->op_type) {
9937                 case OP_LEAVESUB:
9938                 case OP_LEAVESUBLV:
9939                 case OP_LEAVEEVAL:
9940                 case OP_LEAVE:
9941                 case OP_SCOPE:
9942                 case OP_LEAVEWRITE:
9943                     TOPPTR(nss,ix) = ptr;
9944                     o = (OP*)ptr;
9945                     OpREFCNT_inc(o);
9946                     break;
9947                 default:
9948                     TOPPTR(nss,ix) = Nullop;
9949                     break;
9950                 }
9951             }
9952             else
9953                 TOPPTR(nss,ix) = Nullop;
9954             break;
9955         case SAVEt_FREEPV:
9956             c = (char*)POPPTR(ss,ix);
9957             TOPPTR(nss,ix) = pv_dup_inc(c);
9958             break;
9959         case SAVEt_CLEARSV:
9960             longval = POPLONG(ss,ix);
9961             TOPLONG(nss,ix) = longval;
9962             break;
9963         case SAVEt_DELETE:
9964             hv = (HV*)POPPTR(ss,ix);
9965             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9966             c = (char*)POPPTR(ss,ix);
9967             TOPPTR(nss,ix) = pv_dup_inc(c);
9968             i = POPINT(ss,ix);
9969             TOPINT(nss,ix) = i;
9970             break;
9971         case SAVEt_DESTRUCTOR:
9972             ptr = POPPTR(ss,ix);
9973             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9974             dptr = POPDPTR(ss,ix);
9975             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
9976                                         any_dup(FPTR2DPTR(void *, dptr),
9977                                                 proto_perl));
9978             break;
9979         case SAVEt_DESTRUCTOR_X:
9980             ptr = POPPTR(ss,ix);
9981             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9982             dxptr = POPDXPTR(ss,ix);
9983             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
9984                                          any_dup(FPTR2DPTR(void *, dxptr),
9985                                                  proto_perl));
9986             break;
9987         case SAVEt_REGCONTEXT:
9988         case SAVEt_ALLOC:
9989             i = POPINT(ss,ix);
9990             TOPINT(nss,ix) = i;
9991             ix -= i;
9992             break;
9993         case SAVEt_STACK_POS:           /* Position on Perl stack */
9994             i = POPINT(ss,ix);
9995             TOPINT(nss,ix) = i;
9996             break;
9997         case SAVEt_AELEM:               /* array element */
9998             sv = (SV*)POPPTR(ss,ix);
9999             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10000             i = POPINT(ss,ix);
10001             TOPINT(nss,ix) = i;
10002             av = (AV*)POPPTR(ss,ix);
10003             TOPPTR(nss,ix) = av_dup_inc(av, param);
10004             break;
10005         case SAVEt_HELEM:               /* hash element */
10006             sv = (SV*)POPPTR(ss,ix);
10007             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10008             sv = (SV*)POPPTR(ss,ix);
10009             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
10010             hv = (HV*)POPPTR(ss,ix);
10011             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
10012             break;
10013         case SAVEt_OP:
10014             ptr = POPPTR(ss,ix);
10015             TOPPTR(nss,ix) = ptr;
10016             break;
10017         case SAVEt_HINTS:
10018             i = POPINT(ss,ix);
10019             TOPINT(nss,ix) = i;
10020             break;
10021         case SAVEt_COMPPAD:
10022             av = (AV*)POPPTR(ss,ix);
10023             TOPPTR(nss,ix) = av_dup(av, param);
10024             break;
10025         case SAVEt_PADSV:
10026             longval = (long)POPLONG(ss,ix);
10027             TOPLONG(nss,ix) = longval;
10028             ptr = POPPTR(ss,ix);
10029             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10030             sv = (SV*)POPPTR(ss,ix);
10031             TOPPTR(nss,ix) = sv_dup(sv, param);
10032             break;
10033         case SAVEt_BOOL:
10034             ptr = POPPTR(ss,ix);
10035             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
10036             longval = (long)POPBOOL(ss,ix);
10037             TOPBOOL(nss,ix) = (bool)longval;
10038             break;
10039         case SAVEt_SET_SVFLAGS:
10040             i = POPINT(ss,ix);
10041             TOPINT(nss,ix) = i;
10042             i = POPINT(ss,ix);
10043             TOPINT(nss,ix) = i;
10044             sv = (SV*)POPPTR(ss,ix);
10045             TOPPTR(nss,ix) = sv_dup(sv, param);
10046             break;
10047         default:
10048             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
10049         }
10050     }
10051
10052     return nss;
10053 }
10054
10055
10056 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
10057  * flag to the result. This is done for each stash before cloning starts,
10058  * so we know which stashes want their objects cloned */
10059
10060 static void
10061 do_mark_cloneable_stash(pTHX_ SV *sv)
10062 {
10063     const HEK * const hvname = HvNAME_HEK((HV*)sv);
10064     if (hvname) {
10065         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
10066         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
10067         if (cloner && GvCV(cloner)) {
10068             dSP;
10069             UV status;
10070
10071             ENTER;
10072             SAVETMPS;
10073             PUSHMARK(SP);
10074             XPUSHs(sv_2mortal(newSVhek(hvname)));
10075             PUTBACK;
10076             call_sv((SV*)GvCV(cloner), G_SCALAR);
10077             SPAGAIN;
10078             status = POPu;
10079             PUTBACK;
10080             FREETMPS;
10081             LEAVE;
10082             if (status)
10083                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
10084         }
10085     }
10086 }
10087
10088
10089
10090 /*
10091 =for apidoc perl_clone
10092
10093 Create and return a new interpreter by cloning the current one.
10094
10095 perl_clone takes these flags as parameters:
10096
10097 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10098 without it we only clone the data and zero the stacks,
10099 with it we copy the stacks and the new perl interpreter is
10100 ready to run at the exact same point as the previous one.
10101 The pseudo-fork code uses COPY_STACKS while the
10102 threads->new doesn't.
10103
10104 CLONEf_KEEP_PTR_TABLE
10105 perl_clone keeps a ptr_table with the pointer of the old
10106 variable as a key and the new variable as a value,
10107 this allows it to check if something has been cloned and not
10108 clone it again but rather just use the value and increase the
10109 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10110 the ptr_table using the function
10111 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10112 reason to keep it around is if you want to dup some of your own
10113 variable who are outside the graph perl scans, example of this
10114 code is in threads.xs create
10115
10116 CLONEf_CLONE_HOST
10117 This is a win32 thing, it is ignored on unix, it tells perls
10118 win32host code (which is c++) to clone itself, this is needed on
10119 win32 if you want to run two threads at the same time,
10120 if you just want to do some stuff in a separate perl interpreter
10121 and then throw it away and return to the original one,
10122 you don't need to do anything.
10123
10124 =cut
10125 */
10126
10127 /* XXX the above needs expanding by someone who actually understands it ! */
10128 EXTERN_C PerlInterpreter *
10129 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10130
10131 PerlInterpreter *
10132 perl_clone(PerlInterpreter *proto_perl, UV flags)
10133 {
10134    dVAR;
10135 #ifdef PERL_IMPLICIT_SYS
10136
10137    /* perlhost.h so we need to call into it
10138    to clone the host, CPerlHost should have a c interface, sky */
10139
10140    if (flags & CLONEf_CLONE_HOST) {
10141        return perl_clone_host(proto_perl,flags);
10142    }
10143    return perl_clone_using(proto_perl, flags,
10144                             proto_perl->IMem,
10145                             proto_perl->IMemShared,
10146                             proto_perl->IMemParse,
10147                             proto_perl->IEnv,
10148                             proto_perl->IStdIO,
10149                             proto_perl->ILIO,
10150                             proto_perl->IDir,
10151                             proto_perl->ISock,
10152                             proto_perl->IProc);
10153 }
10154
10155 PerlInterpreter *
10156 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10157                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10158                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10159                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10160                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10161                  struct IPerlProc* ipP)
10162 {
10163     /* XXX many of the string copies here can be optimized if they're
10164      * constants; they need to be allocated as common memory and just
10165      * their pointers copied. */
10166
10167     IV i;
10168     CLONE_PARAMS clone_params;
10169     CLONE_PARAMS* param = &clone_params;
10170
10171     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10172     /* for each stash, determine whether its objects should be cloned */
10173     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10174     PERL_SET_THX(my_perl);
10175
10176 #  ifdef DEBUGGING
10177     Poison(my_perl, 1, PerlInterpreter);
10178     PL_op = Nullop;
10179     PL_curcop = (COP *)Nullop;
10180     PL_markstack = 0;
10181     PL_scopestack = 0;
10182     PL_savestack = 0;
10183     PL_savestack_ix = 0;
10184     PL_savestack_max = -1;
10185     PL_sig_pending = 0;
10186     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10187 #  else /* !DEBUGGING */
10188     Zero(my_perl, 1, PerlInterpreter);
10189 #  endif        /* DEBUGGING */
10190
10191     /* host pointers */
10192     PL_Mem              = ipM;
10193     PL_MemShared        = ipMS;
10194     PL_MemParse         = ipMP;
10195     PL_Env              = ipE;
10196     PL_StdIO            = ipStd;
10197     PL_LIO              = ipLIO;
10198     PL_Dir              = ipD;
10199     PL_Sock             = ipS;
10200     PL_Proc             = ipP;
10201 #else           /* !PERL_IMPLICIT_SYS */
10202     IV i;
10203     CLONE_PARAMS clone_params;
10204     CLONE_PARAMS* param = &clone_params;
10205     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10206     /* for each stash, determine whether its objects should be cloned */
10207     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10208     PERL_SET_THX(my_perl);
10209
10210 #    ifdef DEBUGGING
10211     Poison(my_perl, 1, PerlInterpreter);
10212     PL_op = Nullop;
10213     PL_curcop = (COP *)Nullop;
10214     PL_markstack = 0;
10215     PL_scopestack = 0;
10216     PL_savestack = 0;
10217     PL_savestack_ix = 0;
10218     PL_savestack_max = -1;
10219     PL_sig_pending = 0;
10220     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10221 #    else       /* !DEBUGGING */
10222     Zero(my_perl, 1, PerlInterpreter);
10223 #    endif      /* DEBUGGING */
10224 #endif          /* PERL_IMPLICIT_SYS */
10225     param->flags = flags;
10226     param->proto_perl = proto_perl;
10227
10228     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10229     Zero(&PL_body_roots, 1, PL_body_roots);
10230     
10231     PL_nice_chunk       = NULL;
10232     PL_nice_chunk_size  = 0;
10233     PL_sv_count         = 0;
10234     PL_sv_objcount      = 0;
10235     PL_sv_root          = Nullsv;
10236     PL_sv_arenaroot     = Nullsv;
10237
10238     PL_debug            = proto_perl->Idebug;
10239
10240     PL_hash_seed        = proto_perl->Ihash_seed;
10241     PL_rehash_seed      = proto_perl->Irehash_seed;
10242
10243 #ifdef USE_REENTRANT_API
10244     /* XXX: things like -Dm will segfault here in perlio, but doing
10245      *  PERL_SET_CONTEXT(proto_perl);
10246      * breaks too many other things
10247      */
10248     Perl_reentrant_init(aTHX);
10249 #endif
10250
10251     /* create SV map for pointer relocation */
10252     PL_ptr_table = ptr_table_new();
10253
10254     /* initialize these special pointers as early as possible */
10255     SvANY(&PL_sv_undef)         = NULL;
10256     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10257     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10258     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10259
10260     SvANY(&PL_sv_no)            = new_XPVNV();
10261     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10262     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10263                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10264     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10265     SvCUR_set(&PL_sv_no, 0);
10266     SvLEN_set(&PL_sv_no, 1);
10267     SvIV_set(&PL_sv_no, 0);
10268     SvNV_set(&PL_sv_no, 0);
10269     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10270
10271     SvANY(&PL_sv_yes)           = new_XPVNV();
10272     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10273     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10274                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10275     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10276     SvCUR_set(&PL_sv_yes, 1);
10277     SvLEN_set(&PL_sv_yes, 2);
10278     SvIV_set(&PL_sv_yes, 1);
10279     SvNV_set(&PL_sv_yes, 1);
10280     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10281
10282     /* create (a non-shared!) shared string table */
10283     PL_strtab           = newHV();
10284     HvSHAREKEYS_off(PL_strtab);
10285     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10286     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10287
10288     PL_compiling = proto_perl->Icompiling;
10289
10290     /* These two PVs will be free'd special way so must set them same way op.c does */
10291     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10292     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10293
10294     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10295     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10296
10297     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10298     if (!specialWARN(PL_compiling.cop_warnings))
10299         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10300     if (!specialCopIO(PL_compiling.cop_io))
10301         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10302     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10303
10304     /* pseudo environmental stuff */
10305     PL_origargc         = proto_perl->Iorigargc;
10306     PL_origargv         = proto_perl->Iorigargv;
10307
10308     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10309
10310     /* Set tainting stuff before PerlIO_debug can possibly get called */
10311     PL_tainting         = proto_perl->Itainting;
10312     PL_taint_warn       = proto_perl->Itaint_warn;
10313
10314 #ifdef PERLIO_LAYERS
10315     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10316     PerlIO_clone(aTHX_ proto_perl, param);
10317 #endif
10318
10319     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10320     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10321     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10322     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10323     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10324     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10325
10326     /* switches */
10327     PL_minus_c          = proto_perl->Iminus_c;
10328     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10329     PL_localpatches     = proto_perl->Ilocalpatches;
10330     PL_splitstr         = proto_perl->Isplitstr;
10331     PL_preprocess       = proto_perl->Ipreprocess;
10332     PL_minus_n          = proto_perl->Iminus_n;
10333     PL_minus_p          = proto_perl->Iminus_p;
10334     PL_minus_l          = proto_perl->Iminus_l;
10335     PL_minus_a          = proto_perl->Iminus_a;
10336     PL_minus_E          = proto_perl->Iminus_E;
10337     PL_minus_F          = proto_perl->Iminus_F;
10338     PL_doswitches       = proto_perl->Idoswitches;
10339     PL_dowarn           = proto_perl->Idowarn;
10340     PL_doextract        = proto_perl->Idoextract;
10341     PL_sawampersand     = proto_perl->Isawampersand;
10342     PL_unsafe           = proto_perl->Iunsafe;
10343     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10344     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10345     PL_perldb           = proto_perl->Iperldb;
10346     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10347     PL_exit_flags       = proto_perl->Iexit_flags;
10348
10349     /* magical thingies */
10350     /* XXX time(&PL_basetime) when asked for? */
10351     PL_basetime         = proto_perl->Ibasetime;
10352     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10353
10354     PL_maxsysfd         = proto_perl->Imaxsysfd;
10355     PL_multiline        = proto_perl->Imultiline;
10356     PL_statusvalue      = proto_perl->Istatusvalue;
10357 #ifdef VMS
10358     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10359 #else
10360     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10361 #endif
10362     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10363
10364     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10365     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10366     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10367
10368     /* Clone the regex array */
10369     PL_regex_padav = newAV();
10370     {
10371         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10372         SV* const * const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10373         IV i;
10374         av_push(PL_regex_padav,
10375                 sv_dup_inc(regexen[0],param));
10376         for(i = 1; i <= len; i++) {
10377             const SV * const regex = regexen[i];
10378             SV * const sv =
10379                 SvREPADTMP(regex)
10380                     ? sv_dup_inc(regex, param)
10381                     : SvREFCNT_inc(
10382                         newSViv(PTR2IV(re_dup(
10383                                 INT2PTR(REGEXP *, SvIVX(regex)), param))))
10384                 ;
10385             av_push(PL_regex_padav, sv);
10386         }
10387     }
10388     PL_regex_pad = AvARRAY(PL_regex_padav);
10389
10390     /* shortcuts to various I/O objects */
10391     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10392     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10393     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10394     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10395     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10396     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10397
10398     /* shortcuts to regexp stuff */
10399     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10400
10401     /* shortcuts to misc objects */
10402     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10403
10404     /* shortcuts to debugging objects */
10405     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10406     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10407     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10408     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10409     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10410     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10411     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10412     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10413     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10414
10415     /* symbol tables */
10416     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10417     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10418     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10419     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10420     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10421
10422     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10423     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10424     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10425     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10426     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10427     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10428
10429     PL_sub_generation   = proto_perl->Isub_generation;
10430
10431     /* funky return mechanisms */
10432     PL_forkprocess      = proto_perl->Iforkprocess;
10433
10434     /* subprocess state */
10435     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10436
10437     /* internal state */
10438     PL_maxo             = proto_perl->Imaxo;
10439     if (proto_perl->Iop_mask)
10440         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10441     else
10442         PL_op_mask      = Nullch;
10443     /* PL_asserting        = proto_perl->Iasserting; */
10444
10445     /* current interpreter roots */
10446     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10447     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10448     PL_main_start       = proto_perl->Imain_start;
10449     PL_eval_root        = proto_perl->Ieval_root;
10450     PL_eval_start       = proto_perl->Ieval_start;
10451
10452     /* runtime control stuff */
10453     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10454     PL_copline          = proto_perl->Icopline;
10455
10456     PL_filemode         = proto_perl->Ifilemode;
10457     PL_lastfd           = proto_perl->Ilastfd;
10458     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10459     PL_Argv             = NULL;
10460     PL_Cmd              = Nullch;
10461     PL_gensym           = proto_perl->Igensym;
10462     PL_preambled        = proto_perl->Ipreambled;
10463     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10464     PL_laststatval      = proto_perl->Ilaststatval;
10465     PL_laststype        = proto_perl->Ilaststype;
10466     PL_mess_sv          = Nullsv;
10467
10468     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10469
10470     /* interpreter atexit processing */
10471     PL_exitlistlen      = proto_perl->Iexitlistlen;
10472     if (PL_exitlistlen) {
10473         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10474         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10475     }
10476     else
10477         PL_exitlist     = (PerlExitListEntry*)NULL;
10478
10479     PL_my_cxt_size = proto_perl->Imy_cxt_size;
10480     if (PL_my_cxt_size) {
10481         Newx(PL_my_cxt_list, PL_my_cxt_size, void *);
10482         Copy(proto_perl->Imy_cxt_list, PL_my_cxt_list, PL_my_cxt_size, void *);
10483     }
10484     else
10485         PL_my_cxt_list  = (void**)NULL;
10486     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10487     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10488     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10489
10490     PL_profiledata      = NULL;
10491     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10492     /* PL_rsfp_filters entries have fake IoDIRP() */
10493     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10494
10495     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10496
10497     PAD_CLONE_VARS(proto_perl, param);
10498
10499 #ifdef HAVE_INTERP_INTERN
10500     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10501 #endif
10502
10503     /* more statics moved here */
10504     PL_generation       = proto_perl->Igeneration;
10505     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10506
10507     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10508     PL_in_clean_all     = proto_perl->Iin_clean_all;
10509
10510     PL_uid              = proto_perl->Iuid;
10511     PL_euid             = proto_perl->Ieuid;
10512     PL_gid              = proto_perl->Igid;
10513     PL_egid             = proto_perl->Iegid;
10514     PL_nomemok          = proto_perl->Inomemok;
10515     PL_an               = proto_perl->Ian;
10516     PL_evalseq          = proto_perl->Ievalseq;
10517     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10518     PL_origalen         = proto_perl->Iorigalen;
10519 #ifdef PERL_USES_PL_PIDSTATUS
10520     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10521 #endif
10522     PL_osname           = SAVEPV(proto_perl->Iosname);
10523     PL_sighandlerp      = proto_perl->Isighandlerp;
10524
10525     PL_runops           = proto_perl->Irunops;
10526
10527     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10528
10529 #ifdef CSH
10530     PL_cshlen           = proto_perl->Icshlen;
10531     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10532 #endif
10533
10534     PL_lex_state        = proto_perl->Ilex_state;
10535     PL_lex_defer        = proto_perl->Ilex_defer;
10536     PL_lex_expect       = proto_perl->Ilex_expect;
10537     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10538     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10539     PL_lex_starts       = proto_perl->Ilex_starts;
10540     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10541     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10542     PL_lex_op           = proto_perl->Ilex_op;
10543     PL_lex_inpat        = proto_perl->Ilex_inpat;
10544     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10545     PL_lex_brackets     = proto_perl->Ilex_brackets;
10546     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10547     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10548     PL_lex_casemods     = proto_perl->Ilex_casemods;
10549     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10550     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10551
10552     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10553     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10554     PL_nexttoke         = proto_perl->Inexttoke;
10555
10556     /* XXX This is probably masking the deeper issue of why
10557      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10558      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10559      * (A little debugging with a watchpoint on it may help.)
10560      */
10561     if (SvANY(proto_perl->Ilinestr)) {
10562         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10563         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10564         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10565         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10566         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10567         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10568         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10569         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10570         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10571     }
10572     else {
10573         PL_linestr = NEWSV(65,79);
10574         sv_upgrade(PL_linestr,SVt_PVIV);
10575         sv_setpvn(PL_linestr,"",0);
10576         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10577     }
10578     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10579     PL_pending_ident    = proto_perl->Ipending_ident;
10580     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10581
10582     PL_expect           = proto_perl->Iexpect;
10583
10584     PL_multi_start      = proto_perl->Imulti_start;
10585     PL_multi_end        = proto_perl->Imulti_end;
10586     PL_multi_open       = proto_perl->Imulti_open;
10587     PL_multi_close      = proto_perl->Imulti_close;
10588
10589     PL_error_count      = proto_perl->Ierror_count;
10590     PL_subline          = proto_perl->Isubline;
10591     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10592
10593     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10594     if (SvANY(proto_perl->Ilinestr)) {
10595         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10596         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10597         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10598         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10599         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10600     }
10601     else {
10602         PL_last_uni     = SvPVX(PL_linestr);
10603         PL_last_lop     = SvPVX(PL_linestr);
10604         PL_last_lop_op  = 0;
10605     }
10606     PL_in_my            = proto_perl->Iin_my;
10607     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10608 #ifdef FCRYPT
10609     PL_cryptseen        = proto_perl->Icryptseen;
10610 #endif
10611
10612     PL_hints            = proto_perl->Ihints;
10613
10614     PL_amagic_generation        = proto_perl->Iamagic_generation;
10615
10616 #ifdef USE_LOCALE_COLLATE
10617     PL_collation_ix     = proto_perl->Icollation_ix;
10618     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10619     PL_collation_standard       = proto_perl->Icollation_standard;
10620     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10621     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10622 #endif /* USE_LOCALE_COLLATE */
10623
10624 #ifdef USE_LOCALE_NUMERIC
10625     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10626     PL_numeric_standard = proto_perl->Inumeric_standard;
10627     PL_numeric_local    = proto_perl->Inumeric_local;
10628     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10629 #endif /* !USE_LOCALE_NUMERIC */
10630
10631     /* utf8 character classes */
10632     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10633     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10634     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10635     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10636     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10637     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10638     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10639     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10640     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10641     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10642     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10643     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10644     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10645     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10646     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10647     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10648     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10649     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10650     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10651     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10652
10653     /* Did the locale setup indicate UTF-8? */
10654     PL_utf8locale       = proto_perl->Iutf8locale;
10655     /* Unicode features (see perlrun/-C) */
10656     PL_unicode          = proto_perl->Iunicode;
10657
10658     /* Pre-5.8 signals control */
10659     PL_signals          = proto_perl->Isignals;
10660
10661     /* times() ticks per second */
10662     PL_clocktick        = proto_perl->Iclocktick;
10663
10664     /* Recursion stopper for PerlIO_find_layer */
10665     PL_in_load_module   = proto_perl->Iin_load_module;
10666
10667     /* sort() routine */
10668     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10669
10670     /* Not really needed/useful since the reenrant_retint is "volatile",
10671      * but do it for consistency's sake. */
10672     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10673
10674     /* Hooks to shared SVs and locks. */
10675     PL_sharehook        = proto_perl->Isharehook;
10676     PL_lockhook         = proto_perl->Ilockhook;
10677     PL_unlockhook       = proto_perl->Iunlockhook;
10678     PL_threadhook       = proto_perl->Ithreadhook;
10679
10680     PL_runops_std       = proto_perl->Irunops_std;
10681     PL_runops_dbg       = proto_perl->Irunops_dbg;
10682
10683 #ifdef THREADS_HAVE_PIDS
10684     PL_ppid             = proto_perl->Ippid;
10685 #endif
10686
10687     /* swatch cache */
10688     PL_last_swash_hv    = NULL; /* reinits on demand */
10689     PL_last_swash_klen  = 0;
10690     PL_last_swash_key[0]= '\0';
10691     PL_last_swash_tmps  = (U8*)NULL;
10692     PL_last_swash_slen  = 0;
10693
10694     PL_glob_index       = proto_perl->Iglob_index;
10695     PL_srand_called     = proto_perl->Isrand_called;
10696     PL_uudmap['M']      = 0;            /* reinits on demand */
10697     PL_bitcount         = Nullch;       /* reinits on demand */
10698
10699     if (proto_perl->Ipsig_pend) {
10700         Newxz(PL_psig_pend, SIG_SIZE, int);
10701     }
10702     else {
10703         PL_psig_pend    = (int*)NULL;
10704     }
10705
10706     if (proto_perl->Ipsig_ptr) {
10707         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10708         Newxz(PL_psig_name, SIG_SIZE, SV*);
10709         for (i = 1; i < SIG_SIZE; i++) {
10710             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10711             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10712         }
10713     }
10714     else {
10715         PL_psig_ptr     = (SV**)NULL;
10716         PL_psig_name    = (SV**)NULL;
10717     }
10718
10719     /* thrdvar.h stuff */
10720
10721     if (flags & CLONEf_COPY_STACKS) {
10722         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10723         PL_tmps_ix              = proto_perl->Ttmps_ix;
10724         PL_tmps_max             = proto_perl->Ttmps_max;
10725         PL_tmps_floor           = proto_perl->Ttmps_floor;
10726         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10727         i = 0;
10728         while (i <= PL_tmps_ix) {
10729             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10730             ++i;
10731         }
10732
10733         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10734         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10735         Newxz(PL_markstack, i, I32);
10736         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10737                                                   - proto_perl->Tmarkstack);
10738         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10739                                                   - proto_perl->Tmarkstack);
10740         Copy(proto_perl->Tmarkstack, PL_markstack,
10741              PL_markstack_ptr - PL_markstack + 1, I32);
10742
10743         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10744          * NOTE: unlike the others! */
10745         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10746         PL_scopestack_max       = proto_perl->Tscopestack_max;
10747         Newxz(PL_scopestack, PL_scopestack_max, I32);
10748         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10749
10750         /* NOTE: si_dup() looks at PL_markstack */
10751         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10752
10753         /* PL_curstack          = PL_curstackinfo->si_stack; */
10754         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10755         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10756
10757         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10758         PL_stack_base           = AvARRAY(PL_curstack);
10759         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10760                                                    - proto_perl->Tstack_base);
10761         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10762
10763         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10764          * NOTE: unlike the others! */
10765         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10766         PL_savestack_max        = proto_perl->Tsavestack_max;
10767         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10768         PL_savestack            = ss_dup(proto_perl, param);
10769     }
10770     else {
10771         init_stacks();
10772         ENTER;                  /* perl_destruct() wants to LEAVE; */
10773
10774         /* although we're not duplicating the tmps stack, we should still
10775          * add entries for any SVs on the tmps stack that got cloned by a
10776          * non-refcount means (eg a temp in @_); otherwise they will be
10777          * orphaned
10778          */
10779         for (i = 0; i<= proto_perl->Ttmps_ix; i++) {
10780             SV *nsv = (SV*)ptr_table_fetch(PL_ptr_table,
10781                     proto_perl->Ttmps_stack[i]);
10782             if (nsv && !SvREFCNT(nsv)) {
10783                 EXTEND_MORTAL(1);
10784                 PL_tmps_stack[++PL_tmps_ix] = SvREFCNT_inc(nsv);
10785             }
10786         }
10787     }
10788
10789     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10790     PL_top_env          = &PL_start_env;
10791
10792     PL_op               = proto_perl->Top;
10793
10794     PL_Sv               = Nullsv;
10795     PL_Xpv              = (XPV*)NULL;
10796     PL_na               = proto_perl->Tna;
10797
10798     PL_statbuf          = proto_perl->Tstatbuf;
10799     PL_statcache        = proto_perl->Tstatcache;
10800     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10801     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10802 #ifdef HAS_TIMES
10803     PL_timesbuf         = proto_perl->Ttimesbuf;
10804 #endif
10805
10806     PL_tainted          = proto_perl->Ttainted;
10807     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10808     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10809     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10810     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10811     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10812     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10813     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10814     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10815     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10816
10817     PL_restartop        = proto_perl->Trestartop;
10818     PL_in_eval          = proto_perl->Tin_eval;
10819     PL_delaymagic       = proto_perl->Tdelaymagic;
10820     PL_dirty            = proto_perl->Tdirty;
10821     PL_localizing       = proto_perl->Tlocalizing;
10822
10823     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10824     PL_hv_fetch_ent_mh  = Nullhe;
10825     PL_modcount         = proto_perl->Tmodcount;
10826     PL_lastgotoprobe    = Nullop;
10827     PL_dumpindent       = proto_perl->Tdumpindent;
10828
10829     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10830     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10831     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10832     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10833     PL_efloatbuf        = Nullch;               /* reinits on demand */
10834     PL_efloatsize       = 0;                    /* reinits on demand */
10835
10836     /* regex stuff */
10837
10838     PL_screamfirst      = NULL;
10839     PL_screamnext       = NULL;
10840     PL_maxscream        = -1;                   /* reinits on demand */
10841     PL_lastscream       = Nullsv;
10842
10843     PL_watchaddr        = NULL;
10844     PL_watchok          = Nullch;
10845
10846     PL_regdummy         = proto_perl->Tregdummy;
10847     PL_regprecomp       = Nullch;
10848     PL_regnpar          = 0;
10849     PL_regsize          = 0;
10850     PL_colorset         = 0;            /* reinits PL_colors[] */
10851     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10852     PL_reginput         = Nullch;
10853     PL_regbol           = Nullch;
10854     PL_regeol           = Nullch;
10855     PL_regstartp        = (I32*)NULL;
10856     PL_regendp          = (I32*)NULL;
10857     PL_reglastparen     = (U32*)NULL;
10858     PL_reglastcloseparen        = (U32*)NULL;
10859     PL_regtill          = Nullch;
10860     PL_reg_start_tmp    = (char**)NULL;
10861     PL_reg_start_tmpl   = 0;
10862     PL_regdata          = (struct reg_data*)NULL;
10863     PL_bostr            = Nullch;
10864     PL_reg_flags        = 0;
10865     PL_reg_eval_set     = 0;
10866     PL_regnarrate       = 0;
10867     PL_regprogram       = (regnode*)NULL;
10868     PL_regindent        = 0;
10869     PL_regcc            = (CURCUR*)NULL;
10870     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10871     PL_reg_re           = (regexp*)NULL;
10872     PL_reg_ganch        = Nullch;
10873     PL_reg_sv           = Nullsv;
10874     PL_reg_match_utf8   = FALSE;
10875     PL_reg_magic        = (MAGIC*)NULL;
10876     PL_reg_oldpos       = 0;
10877     PL_reg_oldcurpm     = (PMOP*)NULL;
10878     PL_reg_curpm        = (PMOP*)NULL;
10879     PL_reg_oldsaved     = Nullch;
10880     PL_reg_oldsavedlen  = 0;
10881 #ifdef PERL_OLD_COPY_ON_WRITE
10882     PL_nrs              = Nullsv;
10883 #endif
10884     PL_reg_maxiter      = 0;
10885     PL_reg_leftiter     = 0;
10886     PL_reg_poscache     = Nullch;
10887     PL_reg_poscache_size= 0;
10888
10889     /* RE engine - function pointers */
10890     PL_regcompp         = proto_perl->Tregcompp;
10891     PL_regexecp         = proto_perl->Tregexecp;
10892     PL_regint_start     = proto_perl->Tregint_start;
10893     PL_regint_string    = proto_perl->Tregint_string;
10894     PL_regfree          = proto_perl->Tregfree;
10895
10896     PL_reginterp_cnt    = 0;
10897     PL_reg_starttry     = 0;
10898
10899     /* Pluggable optimizer */
10900     PL_peepp            = proto_perl->Tpeepp;
10901
10902     PL_stashcache       = newHV();
10903
10904     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
10905         ptr_table_free(PL_ptr_table);
10906         PL_ptr_table = NULL;
10907     }
10908
10909     /* Call the ->CLONE method, if it exists, for each of the stashes
10910        identified by sv_dup() above.
10911     */
10912     while(av_len(param->stashes) != -1) {
10913         HV* const stash = (HV*) av_shift(param->stashes);
10914         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
10915         if (cloner && GvCV(cloner)) {
10916             dSP;
10917             ENTER;
10918             SAVETMPS;
10919             PUSHMARK(SP);
10920             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
10921             PUTBACK;
10922             call_sv((SV*)GvCV(cloner), G_DISCARD);
10923             FREETMPS;
10924             LEAVE;
10925         }
10926     }
10927
10928     SvREFCNT_dec(param->stashes);
10929
10930     /* orphaned? eg threads->new inside BEGIN or use */
10931     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
10932         (void)SvREFCNT_inc(PL_compcv);
10933         SAVEFREESV(PL_compcv);
10934     }
10935
10936     return my_perl;
10937 }
10938
10939 #endif /* USE_ITHREADS */
10940
10941 /*
10942 =head1 Unicode Support
10943
10944 =for apidoc sv_recode_to_utf8
10945
10946 The encoding is assumed to be an Encode object, on entry the PV
10947 of the sv is assumed to be octets in that encoding, and the sv
10948 will be converted into Unicode (and UTF-8).
10949
10950 If the sv already is UTF-8 (or if it is not POK), or if the encoding
10951 is not a reference, nothing is done to the sv.  If the encoding is not
10952 an C<Encode::XS> Encoding object, bad things will happen.
10953 (See F<lib/encoding.pm> and L<Encode>).
10954
10955 The PV of the sv is returned.
10956
10957 =cut */
10958
10959 char *
10960 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
10961 {
10962     dVAR;
10963     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
10964         SV *uni;
10965         STRLEN len;
10966         const char *s;
10967         dSP;
10968         ENTER;
10969         SAVETMPS;
10970         save_re_context();
10971         PUSHMARK(sp);
10972         EXTEND(SP, 3);
10973         XPUSHs(encoding);
10974         XPUSHs(sv);
10975 /*
10976   NI-S 2002/07/09
10977   Passing sv_yes is wrong - it needs to be or'ed set of constants
10978   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
10979   remove converted chars from source.
10980
10981   Both will default the value - let them.
10982
10983         XPUSHs(&PL_sv_yes);
10984 */
10985         PUTBACK;
10986         call_method("decode", G_SCALAR);
10987         SPAGAIN;
10988         uni = POPs;
10989         PUTBACK;
10990         s = SvPV_const(uni, len);
10991         if (s != SvPVX_const(sv)) {
10992             SvGROW(sv, len + 1);
10993             Move(s, SvPVX(sv), len + 1, char);
10994             SvCUR_set(sv, len);
10995         }
10996         FREETMPS;
10997         LEAVE;
10998         SvUTF8_on(sv);
10999         return SvPVX(sv);
11000     }
11001     return SvPOKp(sv) ? SvPVX(sv) : NULL;
11002 }
11003
11004 /*
11005 =for apidoc sv_cat_decode
11006
11007 The encoding is assumed to be an Encode object, the PV of the ssv is
11008 assumed to be octets in that encoding and decoding the input starts
11009 from the position which (PV + *offset) pointed to.  The dsv will be
11010 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
11011 when the string tstr appears in decoding output or the input ends on
11012 the PV of the ssv. The value which the offset points will be modified
11013 to the last input position on the ssv.
11014
11015 Returns TRUE if the terminator was found, else returns FALSE.
11016
11017 =cut */
11018
11019 bool
11020 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
11021                    SV *ssv, int *offset, char *tstr, int tlen)
11022 {
11023     dVAR;
11024     bool ret = FALSE;
11025     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
11026         SV *offsv;
11027         dSP;
11028         ENTER;
11029         SAVETMPS;
11030         save_re_context();
11031         PUSHMARK(sp);
11032         EXTEND(SP, 6);
11033         XPUSHs(encoding);
11034         XPUSHs(dsv);
11035         XPUSHs(ssv);
11036         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
11037         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
11038         PUTBACK;
11039         call_method("cat_decode", G_SCALAR);
11040         SPAGAIN;
11041         ret = SvTRUE(TOPs);
11042         *offset = SvIV(offsv);
11043         PUTBACK;
11044         FREETMPS;
11045         LEAVE;
11046     }
11047     else
11048         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
11049     return ret;
11050
11051 }
11052
11053 /* ---------------------------------------------------------------------
11054  *
11055  * support functions for report_uninit()
11056  */
11057
11058 /* the maxiumum size of array or hash where we will scan looking
11059  * for the undefined element that triggered the warning */
11060
11061 #define FUV_MAX_SEARCH_SIZE 1000
11062
11063 /* Look for an entry in the hash whose value has the same SV as val;
11064  * If so, return a mortal copy of the key. */
11065
11066 STATIC SV*
11067 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
11068 {
11069     dVAR;
11070     register HE **array;
11071     I32 i;
11072
11073     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
11074                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
11075         return Nullsv;
11076
11077     array = HvARRAY(hv);
11078
11079     for (i=HvMAX(hv); i>0; i--) {
11080         register HE *entry;
11081         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
11082             if (HeVAL(entry) != val)
11083                 continue;
11084             if (    HeVAL(entry) == &PL_sv_undef ||
11085                     HeVAL(entry) == &PL_sv_placeholder)
11086                 continue;
11087             if (!HeKEY(entry))
11088                 return Nullsv;
11089             if (HeKLEN(entry) == HEf_SVKEY)
11090                 return sv_mortalcopy(HeKEY_sv(entry));
11091             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
11092         }
11093     }
11094     return Nullsv;
11095 }
11096
11097 /* Look for an entry in the array whose value has the same SV as val;
11098  * If so, return the index, otherwise return -1. */
11099
11100 STATIC I32
11101 S_find_array_subscript(pTHX_ AV *av, SV* val)
11102 {
11103     SV** svp;
11104     I32 i;
11105     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
11106                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
11107         return -1;
11108
11109     svp = AvARRAY(av);
11110     for (i=AvFILLp(av); i>=0; i--) {
11111         if (svp[i] == val && svp[i] != &PL_sv_undef)
11112             return i;
11113     }
11114     return -1;
11115 }
11116
11117 /* S_varname(): return the name of a variable, optionally with a subscript.
11118  * If gv is non-zero, use the name of that global, along with gvtype (one
11119  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11120  * targ.  Depending on the value of the subscript_type flag, return:
11121  */
11122
11123 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11124 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11125 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11126 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11127
11128 STATIC SV*
11129 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11130         SV* keyname, I32 aindex, int subscript_type)
11131 {
11132
11133     SV * const name = sv_newmortal();
11134     if (gv) {
11135         char buffer[2];
11136         buffer[0] = gvtype;
11137         buffer[1] = 0;
11138
11139         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11140
11141         gv_fullname4(name, gv, buffer, 0);
11142
11143         if ((unsigned int)SvPVX(name)[1] <= 26) {
11144             buffer[0] = '^';
11145             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11146
11147             /* Swap the 1 unprintable control character for the 2 byte pretty
11148                version - ie substr($name, 1, 1) = $buffer; */
11149             sv_insert(name, 1, 1, buffer, 2);
11150         }
11151     }
11152     else {
11153         U32 unused;
11154         CV * const cv = find_runcv(&unused);
11155         SV *sv;
11156         AV *av;
11157
11158         if (!cv || !CvPADLIST(cv))
11159             return Nullsv;
11160         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11161         sv = *av_fetch(av, targ, FALSE);
11162         /* SvLEN in a pad name is not to be trusted */
11163         sv_setpv(name, SvPV_nolen_const(sv));
11164     }
11165
11166     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11167         SV * const sv = NEWSV(0,0);
11168         *SvPVX(name) = '$';
11169         Perl_sv_catpvf(aTHX_ name, "{%s}",
11170             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11171         SvREFCNT_dec(sv);
11172     }
11173     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11174         *SvPVX(name) = '$';
11175         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11176     }
11177     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11178         Perl_sv_insert(aTHX_ name, 0, 0,  STR_WITH_LEN("within "));
11179
11180     return name;
11181 }
11182
11183
11184 /*
11185 =for apidoc find_uninit_var
11186
11187 Find the name of the undefined variable (if any) that caused the operator o
11188 to issue a "Use of uninitialized value" warning.
11189 If match is true, only return a name if it's value matches uninit_sv.
11190 So roughly speaking, if a unary operator (such as OP_COS) generates a
11191 warning, then following the direct child of the op may yield an
11192 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11193 other hand, with OP_ADD there are two branches to follow, so we only print
11194 the variable name if we get an exact match.
11195
11196 The name is returned as a mortal SV.
11197
11198 Assumes that PL_op is the op that originally triggered the error, and that
11199 PL_comppad/PL_curpad points to the currently executing pad.
11200
11201 =cut
11202 */
11203
11204 STATIC SV *
11205 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11206 {
11207     dVAR;
11208     SV *sv;
11209     AV *av;
11210     GV *gv;
11211     OP *o, *o2, *kid;
11212
11213     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11214                             uninit_sv == &PL_sv_placeholder)))
11215         return Nullsv;
11216
11217     switch (obase->op_type) {
11218
11219     case OP_RV2AV:
11220     case OP_RV2HV:
11221     case OP_PADAV:
11222     case OP_PADHV:
11223       {
11224         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11225         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11226         I32 index = 0;
11227         SV *keysv = Nullsv;
11228         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11229
11230         if (pad) { /* @lex, %lex */
11231             sv = PAD_SVl(obase->op_targ);
11232             gv = Nullgv;
11233         }
11234         else {
11235             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11236             /* @global, %global */
11237                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11238                 if (!gv)
11239                     break;
11240                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11241             }
11242             else /* @{expr}, %{expr} */
11243                 return find_uninit_var(cUNOPx(obase)->op_first,
11244                                                     uninit_sv, match);
11245         }
11246
11247         /* attempt to find a match within the aggregate */
11248         if (hash) {
11249             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11250             if (keysv)
11251                 subscript_type = FUV_SUBSCRIPT_HASH;
11252         }
11253         else {
11254             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11255             if (index >= 0)
11256                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11257         }
11258
11259         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11260             break;
11261
11262         return varname(gv, hash ? '%' : '@', obase->op_targ,
11263                                     keysv, index, subscript_type);
11264       }
11265
11266     case OP_PADSV:
11267         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11268             break;
11269         return varname(Nullgv, '$', obase->op_targ,
11270                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11271
11272     case OP_GVSV:
11273         gv = cGVOPx_gv(obase);
11274         if (!gv || (match && GvSV(gv) != uninit_sv))
11275             break;
11276         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11277
11278     case OP_AELEMFAST:
11279         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11280             if (match) {
11281                 SV **svp;
11282                 av = (AV*)PAD_SV(obase->op_targ);
11283                 if (!av || SvRMAGICAL(av))
11284                     break;
11285                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11286                 if (!svp || *svp != uninit_sv)
11287                     break;
11288             }
11289             return varname(Nullgv, '$', obase->op_targ,
11290                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11291         }
11292         else {
11293             gv = cGVOPx_gv(obase);
11294             if (!gv)
11295                 break;
11296             if (match) {
11297                 SV **svp;
11298                 av = GvAV(gv);
11299                 if (!av || SvRMAGICAL(av))
11300                     break;
11301                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11302                 if (!svp || *svp != uninit_sv)
11303                     break;
11304             }
11305             return varname(gv, '$', 0,
11306                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11307         }
11308         break;
11309
11310     case OP_EXISTS:
11311         o = cUNOPx(obase)->op_first;
11312         if (!o || o->op_type != OP_NULL ||
11313                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11314             break;
11315         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11316
11317     case OP_AELEM:
11318     case OP_HELEM:
11319         if (PL_op == obase)
11320             /* $a[uninit_expr] or $h{uninit_expr} */
11321             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11322
11323         gv = Nullgv;
11324         o = cBINOPx(obase)->op_first;
11325         kid = cBINOPx(obase)->op_last;
11326
11327         /* get the av or hv, and optionally the gv */
11328         sv = Nullsv;
11329         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11330             sv = PAD_SV(o->op_targ);
11331         }
11332         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11333                 && cUNOPo->op_first->op_type == OP_GV)
11334         {
11335             gv = cGVOPx_gv(cUNOPo->op_first);
11336             if (!gv)
11337                 break;
11338             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11339         }
11340         if (!sv)
11341             break;
11342
11343         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11344             /* index is constant */
11345             if (match) {
11346                 if (SvMAGICAL(sv))
11347                     break;
11348                 if (obase->op_type == OP_HELEM) {
11349                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11350                     if (!he || HeVAL(he) != uninit_sv)
11351                         break;
11352                 }
11353                 else {
11354                     SV * const * const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11355                     if (!svp || *svp != uninit_sv)
11356                         break;
11357                 }
11358             }
11359             if (obase->op_type == OP_HELEM)
11360                 return varname(gv, '%', o->op_targ,
11361                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11362             else
11363                 return varname(gv, '@', o->op_targ, Nullsv,
11364                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11365         }
11366         else  {
11367             /* index is an expression;
11368              * attempt to find a match within the aggregate */
11369             if (obase->op_type == OP_HELEM) {
11370                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11371                 if (keysv)
11372                     return varname(gv, '%', o->op_targ,
11373                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11374             }
11375             else {
11376                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11377                 if (index >= 0)
11378                     return varname(gv, '@', o->op_targ,
11379                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11380             }
11381             if (match)
11382                 break;
11383             return varname(gv,
11384                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11385                 ? '@' : '%',
11386                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11387         }
11388
11389         break;
11390
11391     case OP_AASSIGN:
11392         /* only examine RHS */
11393         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11394
11395     case OP_OPEN:
11396         o = cUNOPx(obase)->op_first;
11397         if (o->op_type == OP_PUSHMARK)
11398             o = o->op_sibling;
11399
11400         if (!o->op_sibling) {
11401             /* one-arg version of open is highly magical */
11402
11403             if (o->op_type == OP_GV) { /* open FOO; */
11404                 gv = cGVOPx_gv(o);
11405                 if (match && GvSV(gv) != uninit_sv)
11406                     break;
11407                 return varname(gv, '$', 0,
11408                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11409             }
11410             /* other possibilities not handled are:
11411              * open $x; or open my $x;  should return '${*$x}'
11412              * open expr;               should return '$'.expr ideally
11413              */
11414              break;
11415         }
11416         goto do_op;
11417
11418     /* ops where $_ may be an implicit arg */
11419     case OP_TRANS:
11420     case OP_SUBST:
11421     case OP_MATCH:
11422         if ( !(obase->op_flags & OPf_STACKED)) {
11423             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11424                                  ? PAD_SVl(obase->op_targ)
11425                                  : DEFSV))
11426             {
11427                 sv = sv_newmortal();
11428                 sv_setpvn(sv, "$_", 2);
11429                 return sv;
11430             }
11431         }
11432         goto do_op;
11433
11434     case OP_PRTF:
11435     case OP_PRINT:
11436         /* skip filehandle as it can't produce 'undef' warning  */
11437         o = cUNOPx(obase)->op_first;
11438         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11439             o = o->op_sibling->op_sibling;
11440         goto do_op2;
11441
11442
11443     case OP_RV2SV:
11444     case OP_CUSTOM:
11445     case OP_ENTERSUB:
11446         match = 1; /* XS or custom code could trigger random warnings */
11447         goto do_op;
11448
11449     case OP_SCHOMP:
11450     case OP_CHOMP:
11451         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11452             return sv_2mortal(newSVpvs("${$/}"));
11453         /* FALL THROUGH */
11454
11455     default:
11456     do_op:
11457         if (!(obase->op_flags & OPf_KIDS))
11458             break;
11459         o = cUNOPx(obase)->op_first;
11460         
11461     do_op2:
11462         if (!o)
11463             break;
11464
11465         /* if all except one arg are constant, or have no side-effects,
11466          * or are optimized away, then it's unambiguous */
11467         o2 = Nullop;
11468         for (kid=o; kid; kid = kid->op_sibling) {
11469             if (kid &&
11470                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11471                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11472                   || (kid->op_type == OP_PUSHMARK)
11473                 )
11474             )
11475                 continue;
11476             if (o2) { /* more than one found */
11477                 o2 = Nullop;
11478                 break;
11479             }
11480             o2 = kid;
11481         }
11482         if (o2)
11483             return find_uninit_var(o2, uninit_sv, match);
11484
11485         /* scan all args */
11486         while (o) {
11487             sv = find_uninit_var(o, uninit_sv, 1);
11488             if (sv)
11489                 return sv;
11490             o = o->op_sibling;
11491         }
11492         break;
11493     }
11494     return Nullsv;
11495 }
11496
11497
11498 /*
11499 =for apidoc report_uninit
11500
11501 Print appropriate "Use of uninitialized variable" warning
11502
11503 =cut
11504 */
11505
11506 void
11507 Perl_report_uninit(pTHX_ SV* uninit_sv)
11508 {
11509     if (PL_op) {
11510         SV* varname = Nullsv;
11511         if (uninit_sv) {
11512             varname = find_uninit_var(PL_op, uninit_sv,0);
11513             if (varname)
11514                 sv_insert(varname, 0, 0, " ", 1);
11515         }
11516         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11517                 varname ? SvPV_nolen_const(varname) : "",
11518                 " in ", OP_DESC(PL_op));
11519     }
11520     else
11521         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11522                     "", "", "");
11523 }
11524
11525 /*
11526  * Local variables:
11527  * c-indentation-style: bsd
11528  * c-basic-offset: 4
11529  * indent-tabs-mode: t
11530  * End:
11531  *
11532  * ex: set ts=8 sts=4 sw=4 noet:
11533  */