Add an optimisation to allow proxy constant subroutines to be copied
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* const sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = NULL;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void ** const arena_root    = &PL_body_arenaroots[sv_type];
644     void ** const root          = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void ** const r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void ** const thing_copy = (void **)thing;\
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      - relative_STRUCT_OFFSET(xpv_allocated, XPV, xpv_cur),
813      + relative_STRUCT_OFFSET(xpv_allocated, XPV, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      - relative_STRUCT_OFFSET(xpviv_allocated, XPVIV, xpv_cur),
819      + relative_STRUCT_OFFSET(xpviv_allocated, XPVIV, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      - relative_STRUCT_OFFSET(xpvav_allocated, XPVAV, xav_fill),
835      + relative_STRUCT_OFFSET(xpvav_allocated, XPVAV, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      - relative_STRUCT_OFFSET(xpvhv_allocated, XPVHV, xhv_fill),
841      + relative_STRUCT_OFFSET(xpvhv_allocated, XPVHV, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s = SvPVX_const(sv);
1417           const char * const end = s + SvCUR(sv);
1418           for ( ; s < end && d < limit; s++ ) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 STATIC bool
1629 S_sv_2iuv_common(pTHX_ SV *sv) {
1630     if (SvNOKp(sv)) {
1631         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1632          * without also getting a cached IV/UV from it at the same time
1633          * (ie PV->NV conversion should detect loss of accuracy and cache
1634          * IV or UV at same time to avoid this. */
1635         /* IV-over-UV optimisation - choose to cache IV if possible */
1636
1637         if (SvTYPE(sv) == SVt_NV)
1638             sv_upgrade(sv, SVt_PVNV);
1639
1640         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1641         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1642            certainly cast into the IV range at IV_MAX, whereas the correct
1643            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1644            cases go to UV */
1645         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1646             SvIV_set(sv, I_V(SvNVX(sv)));
1647             if (SvNVX(sv) == (NV) SvIVX(sv)
1648 #ifndef NV_PRESERVES_UV
1649                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1650                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1651                 /* Don't flag it as "accurately an integer" if the number
1652                    came from a (by definition imprecise) NV operation, and
1653                    we're outside the range of NV integer precision */
1654 #endif
1655                 ) {
1656                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1657                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1658                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1659                                       PTR2UV(sv),
1660                                       SvNVX(sv),
1661                                       SvIVX(sv)));
1662
1663             } else {
1664                 /* IV not precise.  No need to convert from PV, as NV
1665                    conversion would already have cached IV if it detected
1666                    that PV->IV would be better than PV->NV->IV
1667                    flags already correct - don't set public IOK.  */
1668                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1669                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1670                                       PTR2UV(sv),
1671                                       SvNVX(sv),
1672                                       SvIVX(sv)));
1673             }
1674             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1675                but the cast (NV)IV_MIN rounds to a the value less (more
1676                negative) than IV_MIN which happens to be equal to SvNVX ??
1677                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1678                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1679                (NV)UVX == NVX are both true, but the values differ. :-(
1680                Hopefully for 2s complement IV_MIN is something like
1681                0x8000000000000000 which will be exact. NWC */
1682         }
1683         else {
1684             SvUV_set(sv, U_V(SvNVX(sv)));
1685             if (
1686                 (SvNVX(sv) == (NV) SvUVX(sv))
1687 #ifndef  NV_PRESERVES_UV
1688                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1689                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1690                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1691                 /* Don't flag it as "accurately an integer" if the number
1692                    came from a (by definition imprecise) NV operation, and
1693                    we're outside the range of NV integer precision */
1694 #endif
1695                 )
1696                 SvIOK_on(sv);
1697             SvIsUV_on(sv);
1698             DEBUG_c(PerlIO_printf(Perl_debug_log,
1699                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1700                                   PTR2UV(sv),
1701                                   SvUVX(sv),
1702                                   SvUVX(sv)));
1703         }
1704     }
1705     else if (SvPOKp(sv) && SvLEN(sv)) {
1706         UV value;
1707         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1708         /* We want to avoid a possible problem when we cache an IV/ a UV which
1709            may be later translated to an NV, and the resulting NV is not
1710            the same as the direct translation of the initial string
1711            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1712            be careful to ensure that the value with the .456 is around if the
1713            NV value is requested in the future).
1714         
1715            This means that if we cache such an IV/a UV, we need to cache the
1716            NV as well.  Moreover, we trade speed for space, and do not
1717            cache the NV if we are sure it's not needed.
1718          */
1719
1720         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1721         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1722              == IS_NUMBER_IN_UV) {
1723             /* It's definitely an integer, only upgrade to PVIV */
1724             if (SvTYPE(sv) < SVt_PVIV)
1725                 sv_upgrade(sv, SVt_PVIV);
1726             (void)SvIOK_on(sv);
1727         } else if (SvTYPE(sv) < SVt_PVNV)
1728             sv_upgrade(sv, SVt_PVNV);
1729
1730         /* If NV preserves UV then we only use the UV value if we know that
1731            we aren't going to call atof() below. If NVs don't preserve UVs
1732            then the value returned may have more precision than atof() will
1733            return, even though value isn't perfectly accurate.  */
1734         if ((numtype & (IS_NUMBER_IN_UV
1735 #ifdef NV_PRESERVES_UV
1736                         | IS_NUMBER_NOT_INT
1737 #endif
1738             )) == IS_NUMBER_IN_UV) {
1739             /* This won't turn off the public IOK flag if it was set above  */
1740             (void)SvIOKp_on(sv);
1741
1742             if (!(numtype & IS_NUMBER_NEG)) {
1743                 /* positive */;
1744                 if (value <= (UV)IV_MAX) {
1745                     SvIV_set(sv, (IV)value);
1746                 } else {
1747                     /* it didn't overflow, and it was positive. */
1748                     SvUV_set(sv, value);
1749                     SvIsUV_on(sv);
1750                 }
1751             } else {
1752                 /* 2s complement assumption  */
1753                 if (value <= (UV)IV_MIN) {
1754                     SvIV_set(sv, -(IV)value);
1755                 } else {
1756                     /* Too negative for an IV.  This is a double upgrade, but
1757                        I'm assuming it will be rare.  */
1758                     if (SvTYPE(sv) < SVt_PVNV)
1759                         sv_upgrade(sv, SVt_PVNV);
1760                     SvNOK_on(sv);
1761                     SvIOK_off(sv);
1762                     SvIOKp_on(sv);
1763                     SvNV_set(sv, -(NV)value);
1764                     SvIV_set(sv, IV_MIN);
1765                 }
1766             }
1767         }
1768         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1769            will be in the previous block to set the IV slot, and the next
1770            block to set the NV slot.  So no else here.  */
1771         
1772         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1773             != IS_NUMBER_IN_UV) {
1774             /* It wasn't an (integer that doesn't overflow the UV). */
1775             SvNV_set(sv, Atof(SvPVX_const(sv)));
1776
1777             if (! numtype && ckWARN(WARN_NUMERIC))
1778                 not_a_number(sv);
1779
1780 #if defined(USE_LONG_DOUBLE)
1781             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1782                                   PTR2UV(sv), SvNVX(sv)));
1783 #else
1784             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1785                                   PTR2UV(sv), SvNVX(sv)));
1786 #endif
1787
1788 #ifdef NV_PRESERVES_UV
1789             (void)SvIOKp_on(sv);
1790             (void)SvNOK_on(sv);
1791             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1792                 SvIV_set(sv, I_V(SvNVX(sv)));
1793                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1794                     SvIOK_on(sv);
1795                 } else {
1796                     /* Integer is imprecise. NOK, IOKp */
1797                 }
1798                 /* UV will not work better than IV */
1799             } else {
1800                 if (SvNVX(sv) > (NV)UV_MAX) {
1801                     SvIsUV_on(sv);
1802                     /* Integer is inaccurate. NOK, IOKp, is UV */
1803                     SvUV_set(sv, UV_MAX);
1804                 } else {
1805                     SvUV_set(sv, U_V(SvNVX(sv)));
1806                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
1807                        NV preservse UV so can do correct comparison.  */
1808                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1809                         SvIOK_on(sv);
1810                     } else {
1811                         /* Integer is imprecise. NOK, IOKp, is UV */
1812                     }
1813                 }
1814                 SvIsUV_on(sv);
1815             }
1816 #else /* NV_PRESERVES_UV */
1817             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1818                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1819                 /* The IV/UV slot will have been set from value returned by
1820                    grok_number above.  The NV slot has just been set using
1821                    Atof.  */
1822                 SvNOK_on(sv);
1823                 assert (SvIOKp(sv));
1824             } else {
1825                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1826                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1827                     /* Small enough to preserve all bits. */
1828                     (void)SvIOKp_on(sv);
1829                     SvNOK_on(sv);
1830                     SvIV_set(sv, I_V(SvNVX(sv)));
1831                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1832                         SvIOK_on(sv);
1833                     /* Assumption: first non-preserved integer is < IV_MAX,
1834                        this NV is in the preserved range, therefore: */
1835                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1836                           < (UV)IV_MAX)) {
1837                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1838                     }
1839                 } else {
1840                     /* IN_UV NOT_INT
1841                          0      0       already failed to read UV.
1842                          0      1       already failed to read UV.
1843                          1      0       you won't get here in this case. IV/UV
1844                                         slot set, public IOK, Atof() unneeded.
1845                          1      1       already read UV.
1846                        so there's no point in sv_2iuv_non_preserve() attempting
1847                        to use atol, strtol, strtoul etc.  */
1848                     sv_2iuv_non_preserve (sv, numtype);
1849                 }
1850             }
1851 #endif /* NV_PRESERVES_UV */
1852         }
1853     }
1854     else  {
1855         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1856             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1857                 report_uninit(sv);
1858         }
1859         if (SvTYPE(sv) < SVt_IV)
1860             /* Typically the caller expects that sv_any is not NULL now.  */
1861             sv_upgrade(sv, SVt_IV);
1862         /* Return 0 from the caller.  */
1863         return TRUE;
1864     }
1865     return FALSE;
1866 }
1867
1868 /*
1869 =for apidoc sv_2iv_flags
1870
1871 Return the integer value of an SV, doing any necessary string
1872 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1873 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1874
1875 =cut
1876 */
1877
1878 IV
1879 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1880 {
1881     if (!sv)
1882         return 0;
1883     if (SvGMAGICAL(sv)) {
1884         if (flags & SV_GMAGIC)
1885             mg_get(sv);
1886         if (SvIOKp(sv))
1887             return SvIVX(sv);
1888         if (SvNOKp(sv)) {
1889             return I_V(SvNVX(sv));
1890         }
1891         if (SvPOKp(sv) && SvLEN(sv)) {
1892             UV value;
1893             const int numtype
1894                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1895
1896             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1897                 == IS_NUMBER_IN_UV) {
1898                 /* It's definitely an integer */
1899                 if (numtype & IS_NUMBER_NEG) {
1900                     if (value < (UV)IV_MIN)
1901                         return -(IV)value;
1902                 } else {
1903                     if (value < (UV)IV_MAX)
1904                         return (IV)value;
1905                 }
1906             }
1907             if (!numtype) {
1908                 if (ckWARN(WARN_NUMERIC))
1909                     not_a_number(sv);
1910             }
1911             return I_V(Atof(SvPVX_const(sv)));
1912         }
1913         if (SvROK(sv)) {
1914             goto return_rok;
1915         }
1916         assert(SvTYPE(sv) >= SVt_PVMG);
1917         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
1918     } else if (SvTHINKFIRST(sv)) {
1919         if (SvROK(sv)) {
1920         return_rok:
1921             if (SvAMAGIC(sv)) {
1922                 SV * const tmpstr=AMG_CALLun(sv,numer);
1923                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1924                     return SvIV(tmpstr);
1925                 }
1926             }
1927             return PTR2IV(SvRV(sv));
1928         }
1929         if (SvIsCOW(sv)) {
1930             sv_force_normal_flags(sv, 0);
1931         }
1932         if (SvREADONLY(sv) && !SvOK(sv)) {
1933             if (ckWARN(WARN_UNINITIALIZED))
1934                 report_uninit(sv);
1935             return 0;
1936         }
1937     }
1938     if (!SvIOKp(sv)) {
1939         if (S_sv_2iuv_common(aTHX_ sv))
1940             return 0;
1941     }
1942     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1943         PTR2UV(sv),SvIVX(sv)));
1944     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1945 }
1946
1947 /*
1948 =for apidoc sv_2uv_flags
1949
1950 Return the unsigned integer value of an SV, doing any necessary string
1951 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1952 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1953
1954 =cut
1955 */
1956
1957 UV
1958 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1959 {
1960     if (!sv)
1961         return 0;
1962     if (SvGMAGICAL(sv)) {
1963         if (flags & SV_GMAGIC)
1964             mg_get(sv);
1965         if (SvIOKp(sv))
1966             return SvUVX(sv);
1967         if (SvNOKp(sv))
1968             return U_V(SvNVX(sv));
1969         if (SvPOKp(sv) && SvLEN(sv)) {
1970             UV value;
1971             const int numtype
1972                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1973
1974             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1975                 == IS_NUMBER_IN_UV) {
1976                 /* It's definitely an integer */
1977                 if (!(numtype & IS_NUMBER_NEG))
1978                     return value;
1979             }
1980             if (!numtype) {
1981                 if (ckWARN(WARN_NUMERIC))
1982                     not_a_number(sv);
1983             }
1984             return U_V(Atof(SvPVX_const(sv)));
1985         }
1986         if (SvROK(sv)) {
1987             goto return_rok;
1988         }
1989         assert(SvTYPE(sv) >= SVt_PVMG);
1990         /* This falls through to the report_uninit inside S_sv_2iuv_common.  */
1991     } else if (SvTHINKFIRST(sv)) {
1992         if (SvROK(sv)) {
1993         return_rok:
1994             if (SvAMAGIC(sv)) {
1995                 SV *const tmpstr = AMG_CALLun(sv,numer);
1996                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1997                     return SvUV(tmpstr);
1998                 }
1999             }
2000             return PTR2UV(SvRV(sv));
2001         }
2002         if (SvIsCOW(sv)) {
2003             sv_force_normal_flags(sv, 0);
2004         }
2005         if (SvREADONLY(sv) && !SvOK(sv)) {
2006             if (ckWARN(WARN_UNINITIALIZED))
2007                 report_uninit(sv);
2008             return 0;
2009         }
2010     }
2011     if (!SvIOKp(sv)) {
2012         if (S_sv_2iuv_common(aTHX_ sv))
2013             return 0;
2014     }
2015
2016     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2017                           PTR2UV(sv),SvUVX(sv)));
2018     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2019 }
2020
2021 /*
2022 =for apidoc sv_2nv
2023
2024 Return the num value of an SV, doing any necessary string or integer
2025 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2026 macros.
2027
2028 =cut
2029 */
2030
2031 NV
2032 Perl_sv_2nv(pTHX_ register SV *sv)
2033 {
2034     if (!sv)
2035         return 0.0;
2036     if (SvGMAGICAL(sv)) {
2037         mg_get(sv);
2038         if (SvNOKp(sv))
2039             return SvNVX(sv);
2040         if (SvPOKp(sv) && SvLEN(sv)) {
2041             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2042                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2043                 not_a_number(sv);
2044             return Atof(SvPVX_const(sv));
2045         }
2046         if (SvIOKp(sv)) {
2047             if (SvIsUV(sv))
2048                 return (NV)SvUVX(sv);
2049             else
2050                 return (NV)SvIVX(sv);
2051         }
2052         if (SvROK(sv)) {
2053             goto return_rok;
2054         }
2055         assert(SvTYPE(sv) >= SVt_PVMG);
2056         /* This falls through to the report_uninit near the end of the
2057            function. */
2058     } else if (SvTHINKFIRST(sv)) {
2059         if (SvROK(sv)) {
2060         return_rok:
2061             if (SvAMAGIC(sv)) {
2062                 SV *const tmpstr = AMG_CALLun(sv,numer);
2063                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2064                     return SvNV(tmpstr);
2065                 }
2066             }
2067             return PTR2NV(SvRV(sv));
2068         }
2069         if (SvIsCOW(sv)) {
2070             sv_force_normal_flags(sv, 0);
2071         }
2072         if (SvREADONLY(sv) && !SvOK(sv)) {
2073             if (ckWARN(WARN_UNINITIALIZED))
2074                 report_uninit(sv);
2075             return 0.0;
2076         }
2077     }
2078     if (SvTYPE(sv) < SVt_NV) {
2079         /* The logic to use SVt_PVNV if necessary is in sv_upgrade.  */
2080         sv_upgrade(sv, SVt_NV);
2081 #ifdef USE_LONG_DOUBLE
2082         DEBUG_c({
2083             STORE_NUMERIC_LOCAL_SET_STANDARD();
2084             PerlIO_printf(Perl_debug_log,
2085                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2086                           PTR2UV(sv), SvNVX(sv));
2087             RESTORE_NUMERIC_LOCAL();
2088         });
2089 #else
2090         DEBUG_c({
2091             STORE_NUMERIC_LOCAL_SET_STANDARD();
2092             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2093                           PTR2UV(sv), SvNVX(sv));
2094             RESTORE_NUMERIC_LOCAL();
2095         });
2096 #endif
2097     }
2098     else if (SvTYPE(sv) < SVt_PVNV)
2099         sv_upgrade(sv, SVt_PVNV);
2100     if (SvNOKp(sv)) {
2101         return SvNVX(sv);
2102     }
2103     if (SvIOKp(sv)) {
2104         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2105 #ifdef NV_PRESERVES_UV
2106         SvNOK_on(sv);
2107 #else
2108         /* Only set the public NV OK flag if this NV preserves the IV  */
2109         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2110         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2111                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2112             SvNOK_on(sv);
2113         else
2114             SvNOKp_on(sv);
2115 #endif
2116     }
2117     else if (SvPOKp(sv) && SvLEN(sv)) {
2118         UV value;
2119         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2120         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2121             not_a_number(sv);
2122 #ifdef NV_PRESERVES_UV
2123         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2124             == IS_NUMBER_IN_UV) {
2125             /* It's definitely an integer */
2126             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2127         } else
2128             SvNV_set(sv, Atof(SvPVX_const(sv)));
2129         SvNOK_on(sv);
2130 #else
2131         SvNV_set(sv, Atof(SvPVX_const(sv)));
2132         /* Only set the public NV OK flag if this NV preserves the value in
2133            the PV at least as well as an IV/UV would.
2134            Not sure how to do this 100% reliably. */
2135         /* if that shift count is out of range then Configure's test is
2136            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2137            UV_BITS */
2138         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2139             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2140             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2141         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2142             /* Can't use strtol etc to convert this string, so don't try.
2143                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2144             SvNOK_on(sv);
2145         } else {
2146             /* value has been set.  It may not be precise.  */
2147             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2148                 /* 2s complement assumption for (UV)IV_MIN  */
2149                 SvNOK_on(sv); /* Integer is too negative.  */
2150             } else {
2151                 SvNOKp_on(sv);
2152                 SvIOKp_on(sv);
2153
2154                 if (numtype & IS_NUMBER_NEG) {
2155                     SvIV_set(sv, -(IV)value);
2156                 } else if (value <= (UV)IV_MAX) {
2157                     SvIV_set(sv, (IV)value);
2158                 } else {
2159                     SvUV_set(sv, value);
2160                     SvIsUV_on(sv);
2161                 }
2162
2163                 if (numtype & IS_NUMBER_NOT_INT) {
2164                     /* I believe that even if the original PV had decimals,
2165                        they are lost beyond the limit of the FP precision.
2166                        However, neither is canonical, so both only get p
2167                        flags.  NWC, 2000/11/25 */
2168                     /* Both already have p flags, so do nothing */
2169                 } else {
2170                     const NV nv = SvNVX(sv);
2171                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2172                         if (SvIVX(sv) == I_V(nv)) {
2173                             SvNOK_on(sv);
2174                         } else {
2175                             /* It had no "." so it must be integer.  */
2176                         }
2177                         SvIOK_on(sv);
2178                     } else {
2179                         /* between IV_MAX and NV(UV_MAX).
2180                            Could be slightly > UV_MAX */
2181
2182                         if (numtype & IS_NUMBER_NOT_INT) {
2183                             /* UV and NV both imprecise.  */
2184                         } else {
2185                             const UV nv_as_uv = U_V(nv);
2186
2187                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2188                                 SvNOK_on(sv);
2189                             }
2190                             SvIOK_on(sv);
2191                         }
2192                     }
2193                 }
2194             }
2195         }
2196 #endif /* NV_PRESERVES_UV */
2197     }
2198     else  {
2199         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2200             report_uninit(sv);
2201         assert (SvTYPE(sv) >= SVt_NV);
2202         /* Typically the caller expects that sv_any is not NULL now.  */
2203         /* XXX Ilya implies that this is a bug in callers that assume this
2204            and ideally should be fixed.  */
2205         return 0.0;
2206     }
2207 #if defined(USE_LONG_DOUBLE)
2208     DEBUG_c({
2209         STORE_NUMERIC_LOCAL_SET_STANDARD();
2210         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2211                       PTR2UV(sv), SvNVX(sv));
2212         RESTORE_NUMERIC_LOCAL();
2213     });
2214 #else
2215     DEBUG_c({
2216         STORE_NUMERIC_LOCAL_SET_STANDARD();
2217         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2218                       PTR2UV(sv), SvNVX(sv));
2219         RESTORE_NUMERIC_LOCAL();
2220     });
2221 #endif
2222     return SvNVX(sv);
2223 }
2224
2225 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2226  * UV as a string towards the end of buf, and return pointers to start and
2227  * end of it.
2228  *
2229  * We assume that buf is at least TYPE_CHARS(UV) long.
2230  */
2231
2232 static char *
2233 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2234 {
2235     char *ptr = buf + TYPE_CHARS(UV);
2236     char * const ebuf = ptr;
2237     int sign;
2238
2239     if (is_uv)
2240         sign = 0;
2241     else if (iv >= 0) {
2242         uv = iv;
2243         sign = 0;
2244     } else {
2245         uv = -iv;
2246         sign = 1;
2247     }
2248     do {
2249         *--ptr = '0' + (char)(uv % 10);
2250     } while (uv /= 10);
2251     if (sign)
2252         *--ptr = '-';
2253     *peob = ebuf;
2254     return ptr;
2255 }
2256
2257 /* stringify_regexp(): private routine for use by sv_2pv_flags(): converts
2258  * a regexp to its stringified form.
2259  */
2260
2261 static char *
2262 S_stringify_regexp(pTHX_ SV *sv, MAGIC *mg, STRLEN *lp) {
2263     const regexp * const re = (regexp *)mg->mg_obj;
2264
2265     if (!mg->mg_ptr) {
2266         const char *fptr = "msix";
2267         char reflags[6];
2268         char ch;
2269         int left = 0;
2270         int right = 4;
2271         bool need_newline = 0;
2272         U16 reganch = (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2273
2274         while((ch = *fptr++)) {
2275             if(reganch & 1) {
2276                 reflags[left++] = ch;
2277             }
2278             else {
2279                 reflags[right--] = ch;
2280             }
2281             reganch >>= 1;
2282         }
2283         if(left != 4) {
2284             reflags[left] = '-';
2285             left = 5;
2286         }
2287
2288         mg->mg_len = re->prelen + 4 + left;
2289         /*
2290          * If /x was used, we have to worry about a regex ending with a
2291          * comment later being embedded within another regex. If so, we don't
2292          * want this regex's "commentization" to leak out to the right part of
2293          * the enclosing regex, we must cap it with a newline.
2294          *
2295          * So, if /x was used, we scan backwards from the end of the regex. If
2296          * we find a '#' before we find a newline, we need to add a newline
2297          * ourself. If we find a '\n' first (or if we don't find '#' or '\n'),
2298          * we don't need to add anything.  -jfriedl
2299          */
2300         if (PMf_EXTENDED & re->reganch) {
2301             const char *endptr = re->precomp + re->prelen;
2302             while (endptr >= re->precomp) {
2303                 const char c = *(endptr--);
2304                 if (c == '\n')
2305                     break; /* don't need another */
2306                 if (c == '#') {
2307                     /* we end while in a comment, so we need a newline */
2308                     mg->mg_len++; /* save space for it */
2309                     need_newline = 1; /* note to add it */
2310                     break;
2311                 }
2312             }
2313         }
2314
2315         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2316         mg->mg_ptr[0] = '(';
2317         mg->mg_ptr[1] = '?';
2318         Copy(reflags, mg->mg_ptr+2, left, char);
2319         *(mg->mg_ptr+left+2) = ':';
2320         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2321         if (need_newline)
2322             mg->mg_ptr[mg->mg_len - 2] = '\n';
2323         mg->mg_ptr[mg->mg_len - 1] = ')';
2324         mg->mg_ptr[mg->mg_len] = 0;
2325     }
2326     PL_reginterp_cnt += re->program[0].next_off;
2327     
2328     if (re->reganch & ROPT_UTF8)
2329         SvUTF8_on(sv);
2330     else
2331         SvUTF8_off(sv);
2332     if (lp)
2333         *lp = mg->mg_len;
2334     return mg->mg_ptr;
2335 }
2336
2337 /*
2338 =for apidoc sv_2pv_flags
2339
2340 Returns a pointer to the string value of an SV, and sets *lp to its length.
2341 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2342 if necessary.
2343 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2344 usually end up here too.
2345
2346 =cut
2347 */
2348
2349 char *
2350 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2351 {
2352     register char *s;
2353
2354     if (!sv) {
2355         if (lp)
2356             *lp = 0;
2357         return (char *)"";
2358     }
2359     if (SvGMAGICAL(sv)) {
2360         if (flags & SV_GMAGIC)
2361             mg_get(sv);
2362         if (SvPOKp(sv)) {
2363             if (lp)
2364                 *lp = SvCUR(sv);
2365             if (flags & SV_MUTABLE_RETURN)
2366                 return SvPVX_mutable(sv);
2367             if (flags & SV_CONST_RETURN)
2368                 return (char *)SvPVX_const(sv);
2369             return SvPVX(sv);
2370         }
2371         if (SvIOKp(sv) || SvNOKp(sv)) {
2372             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2373             STRLEN len;
2374
2375             if (SvIOKp(sv)) {
2376                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2377                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2378             } else {
2379                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2380                 len = strlen(tbuf);
2381             }
2382             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2383                 /* Sneaky stuff here */
2384                 SV * const tsv = newSVpvn(tbuf, len);
2385
2386                 sv_2mortal(tsv);
2387                 if (lp)
2388                     *lp = SvCUR(tsv);
2389                 return SvPVX(tsv);
2390             }
2391             else {
2392                 dVAR;
2393
2394 #ifdef FIXNEGATIVEZERO
2395                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2396                     tbuf[0] = '0';
2397                     tbuf[1] = 0;
2398                     len = 1;
2399                 }
2400 #endif
2401                 SvUPGRADE(sv, SVt_PV);
2402                 if (lp)
2403                     *lp = len;
2404                 s = SvGROW_mutable(sv, len + 1);
2405                 SvCUR_set(sv, len);
2406                 SvPOKp_on(sv);
2407                 return memcpy(s, tbuf, len + 1);
2408             }
2409         }
2410         if (SvROK(sv)) {
2411             goto return_rok;
2412         }
2413         assert(SvTYPE(sv) >= SVt_PVMG);
2414         /* This falls through to the report_uninit near the end of the
2415            function. */
2416     } else if (SvTHINKFIRST(sv)) {
2417         if (SvROK(sv)) {
2418         return_rok:
2419             if (SvAMAGIC(sv)) {
2420                 SV *const tmpstr = AMG_CALLun(sv,string);
2421                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2422                     /* Unwrap this:  */
2423                     /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr);
2424                      */
2425
2426                     char *pv;
2427                     if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2428                         if (flags & SV_CONST_RETURN) {
2429                             pv = (char *) SvPVX_const(tmpstr);
2430                         } else {
2431                             pv = (flags & SV_MUTABLE_RETURN)
2432                                 ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2433                         }
2434                         if (lp)
2435                             *lp = SvCUR(tmpstr);
2436                     } else {
2437                         pv = sv_2pv_flags(tmpstr, lp, flags);
2438                     }
2439                     if (SvUTF8(tmpstr))
2440                         SvUTF8_on(sv);
2441                     else
2442                         SvUTF8_off(sv);
2443                     return pv;
2444                 }
2445             }
2446             {
2447                 SV *tsv;
2448                 MAGIC *mg;
2449                 const SV *const referent = (SV*)SvRV(sv);
2450
2451                 if (!referent) {
2452                     tsv = sv_2mortal(newSVpvn("NULLREF", 7));
2453                 } else if (SvTYPE(referent) == SVt_PVMG
2454                            && ((SvFLAGS(referent) &
2455                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2456                                == (SVs_OBJECT|SVs_SMG))
2457                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2458                     return S_stringify_regexp(aTHX_ sv, mg, lp);
2459                 } else {
2460                     const char *const typestr = sv_reftype(referent, 0);
2461
2462                     tsv = sv_newmortal();
2463                     if (SvOBJECT(referent)) {
2464                         const char *const name = HvNAME_get(SvSTASH(referent));
2465                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2466                                        name ? name : "__ANON__" , typestr,
2467                                        PTR2UV(referent));
2468                     }
2469                     else
2470                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2471                                        PTR2UV(referent));
2472                 }
2473                 if (lp)
2474                     *lp = SvCUR(tsv);
2475                 return SvPVX(tsv);
2476             }
2477         }
2478         if (SvREADONLY(sv) && !SvOK(sv)) {
2479             if (ckWARN(WARN_UNINITIALIZED))
2480                 report_uninit(sv);
2481             if (lp)
2482                 *lp = 0;
2483             return (char *)"";
2484         }
2485     }
2486     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2487         /* I'm assuming that if both IV and NV are equally valid then
2488            converting the IV is going to be more efficient */
2489         const U32 isIOK = SvIOK(sv);
2490         const U32 isUIOK = SvIsUV(sv);
2491         char buf[TYPE_CHARS(UV)];
2492         char *ebuf, *ptr;
2493
2494         if (SvTYPE(sv) < SVt_PVIV)
2495             sv_upgrade(sv, SVt_PVIV);
2496         ptr = uiv_2buf(buf, SvIVX(sv), SvUVX(sv), isUIOK, &ebuf);
2497         /* inlined from sv_setpvn */
2498         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2499         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2500         SvCUR_set(sv, ebuf - ptr);
2501         s = SvEND(sv);
2502         *s = '\0';
2503         if (isIOK)
2504             SvIOK_on(sv);
2505         else
2506             SvIOKp_on(sv);
2507         if (isUIOK)
2508             SvIsUV_on(sv);
2509     }
2510     else if (SvNOKp(sv)) {
2511         const int olderrno = errno;
2512         if (SvTYPE(sv) < SVt_PVNV)
2513             sv_upgrade(sv, SVt_PVNV);
2514         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2515         s = SvGROW_mutable(sv, NV_DIG + 20);
2516         /* some Xenix systems wipe out errno here */
2517 #ifdef apollo
2518         if (SvNVX(sv) == 0.0)
2519             (void)strcpy(s,"0");
2520         else
2521 #endif /*apollo*/
2522         {
2523             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2524         }
2525         errno = olderrno;
2526 #ifdef FIXNEGATIVEZERO
2527         if (*s == '-' && s[1] == '0' && !s[2])
2528             strcpy(s,"0");
2529 #endif
2530         while (*s) s++;
2531 #ifdef hcx
2532         if (s[-1] == '.')
2533             *--s = '\0';
2534 #endif
2535     }
2536     else {
2537         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2538             report_uninit(sv);
2539         if (lp)
2540             *lp = 0;
2541         if (SvTYPE(sv) < SVt_PV)
2542             /* Typically the caller expects that sv_any is not NULL now.  */
2543             sv_upgrade(sv, SVt_PV);
2544         return (char *)"";
2545     }
2546     {
2547         const STRLEN len = s - SvPVX_const(sv);
2548         if (lp) 
2549             *lp = len;
2550         SvCUR_set(sv, len);
2551     }
2552     SvPOK_on(sv);
2553     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2554                           PTR2UV(sv),SvPVX_const(sv)));
2555     if (flags & SV_CONST_RETURN)
2556         return (char *)SvPVX_const(sv);
2557     if (flags & SV_MUTABLE_RETURN)
2558         return SvPVX_mutable(sv);
2559     return SvPVX(sv);
2560 }
2561
2562 /*
2563 =for apidoc sv_copypv
2564
2565 Copies a stringified representation of the source SV into the
2566 destination SV.  Automatically performs any necessary mg_get and
2567 coercion of numeric values into strings.  Guaranteed to preserve
2568 UTF-8 flag even from overloaded objects.  Similar in nature to
2569 sv_2pv[_flags] but operates directly on an SV instead of just the
2570 string.  Mostly uses sv_2pv_flags to do its work, except when that
2571 would lose the UTF-8'ness of the PV.
2572
2573 =cut
2574 */
2575
2576 void
2577 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2578 {
2579     STRLEN len;
2580     const char * const s = SvPV_const(ssv,len);
2581     sv_setpvn(dsv,s,len);
2582     if (SvUTF8(ssv))
2583         SvUTF8_on(dsv);
2584     else
2585         SvUTF8_off(dsv);
2586 }
2587
2588 /*
2589 =for apidoc sv_2pvbyte
2590
2591 Return a pointer to the byte-encoded representation of the SV, and set *lp
2592 to its length.  May cause the SV to be downgraded from UTF-8 as a
2593 side-effect.
2594
2595 Usually accessed via the C<SvPVbyte> macro.
2596
2597 =cut
2598 */
2599
2600 char *
2601 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2602 {
2603     sv_utf8_downgrade(sv,0);
2604     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2605 }
2606
2607 /*
2608 =for apidoc sv_2pvutf8
2609
2610 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2611 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2612
2613 Usually accessed via the C<SvPVutf8> macro.
2614
2615 =cut
2616 */
2617
2618 char *
2619 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2620 {
2621     sv_utf8_upgrade(sv);
2622     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2623 }
2624
2625
2626 /*
2627 =for apidoc sv_2bool
2628
2629 This function is only called on magical items, and is only used by
2630 sv_true() or its macro equivalent.
2631
2632 =cut
2633 */
2634
2635 bool
2636 Perl_sv_2bool(pTHX_ register SV *sv)
2637 {
2638     SvGETMAGIC(sv);
2639
2640     if (!SvOK(sv))
2641         return 0;
2642     if (SvROK(sv)) {
2643         SV* tmpsv;
2644         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2645                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2646             return (bool)SvTRUE(tmpsv);
2647       return SvRV(sv) != 0;
2648     }
2649     if (SvPOKp(sv)) {
2650         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2651         if (Xpvtmp &&
2652                 (*sv->sv_u.svu_pv > '0' ||
2653                 Xpvtmp->xpv_cur > 1 ||
2654                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2655             return 1;
2656         else
2657             return 0;
2658     }
2659     else {
2660         if (SvIOKp(sv))
2661             return SvIVX(sv) != 0;
2662         else {
2663             if (SvNOKp(sv))
2664                 return SvNVX(sv) != 0.0;
2665             else
2666                 return FALSE;
2667         }
2668     }
2669 }
2670
2671 /*
2672 =for apidoc sv_utf8_upgrade
2673
2674 Converts the PV of an SV to its UTF-8-encoded form.
2675 Forces the SV to string form if it is not already.
2676 Always sets the SvUTF8 flag to avoid future validity checks even
2677 if all the bytes have hibit clear.
2678
2679 This is not as a general purpose byte encoding to Unicode interface:
2680 use the Encode extension for that.
2681
2682 =for apidoc sv_utf8_upgrade_flags
2683
2684 Converts the PV of an SV to its UTF-8-encoded form.
2685 Forces the SV to string form if it is not already.
2686 Always sets the SvUTF8 flag to avoid future validity checks even
2687 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2688 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2689 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2690
2691 This is not as a general purpose byte encoding to Unicode interface:
2692 use the Encode extension for that.
2693
2694 =cut
2695 */
2696
2697 STRLEN
2698 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2699 {
2700     if (sv == &PL_sv_undef)
2701         return 0;
2702     if (!SvPOK(sv)) {
2703         STRLEN len = 0;
2704         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2705             (void) sv_2pv_flags(sv,&len, flags);
2706             if (SvUTF8(sv))
2707                 return len;
2708         } else {
2709             (void) SvPV_force(sv,len);
2710         }
2711     }
2712
2713     if (SvUTF8(sv)) {
2714         return SvCUR(sv);
2715     }
2716
2717     if (SvIsCOW(sv)) {
2718         sv_force_normal_flags(sv, 0);
2719     }
2720
2721     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2722         sv_recode_to_utf8(sv, PL_encoding);
2723     else { /* Assume Latin-1/EBCDIC */
2724         /* This function could be much more efficient if we
2725          * had a FLAG in SVs to signal if there are any hibit
2726          * chars in the PV.  Given that there isn't such a flag
2727          * make the loop as fast as possible. */
2728         const U8 * const s = (U8 *) SvPVX_const(sv);
2729         const U8 * const e = (U8 *) SvEND(sv);
2730         const U8 *t = s;
2731         
2732         while (t < e) {
2733             const U8 ch = *t++;
2734             /* Check for hi bit */
2735             if (!NATIVE_IS_INVARIANT(ch)) {
2736                 STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2737                 U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2738
2739                 SvPV_free(sv); /* No longer using what was there before. */
2740                 SvPV_set(sv, (char*)recoded);
2741                 SvCUR_set(sv, len - 1);
2742                 SvLEN_set(sv, len); /* No longer know the real size. */
2743                 break;
2744             }
2745         }
2746         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2747         SvUTF8_on(sv);
2748     }
2749     return SvCUR(sv);
2750 }
2751
2752 /*
2753 =for apidoc sv_utf8_downgrade
2754
2755 Attempts to convert the PV of an SV from characters to bytes.
2756 If the PV contains a character beyond byte, this conversion will fail;
2757 in this case, either returns false or, if C<fail_ok> is not
2758 true, croaks.
2759
2760 This is not as a general purpose Unicode to byte encoding interface:
2761 use the Encode extension for that.
2762
2763 =cut
2764 */
2765
2766 bool
2767 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
2768 {
2769     if (SvPOKp(sv) && SvUTF8(sv)) {
2770         if (SvCUR(sv)) {
2771             U8 *s;
2772             STRLEN len;
2773
2774             if (SvIsCOW(sv)) {
2775                 sv_force_normal_flags(sv, 0);
2776             }
2777             s = (U8 *) SvPV(sv, len);
2778             if (!utf8_to_bytes(s, &len)) {
2779                 if (fail_ok)
2780                     return FALSE;
2781                 else {
2782                     if (PL_op)
2783                         Perl_croak(aTHX_ "Wide character in %s",
2784                                    OP_DESC(PL_op));
2785                     else
2786                         Perl_croak(aTHX_ "Wide character");
2787                 }
2788             }
2789             SvCUR_set(sv, len);
2790         }
2791     }
2792     SvUTF8_off(sv);
2793     return TRUE;
2794 }
2795
2796 /*
2797 =for apidoc sv_utf8_encode
2798
2799 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
2800 flag off so that it looks like octets again.
2801
2802 =cut
2803 */
2804
2805 void
2806 Perl_sv_utf8_encode(pTHX_ register SV *sv)
2807 {
2808     (void) sv_utf8_upgrade(sv);
2809     if (SvIsCOW(sv)) {
2810         sv_force_normal_flags(sv, 0);
2811     }
2812     if (SvREADONLY(sv)) {
2813         Perl_croak(aTHX_ PL_no_modify);
2814     }
2815     SvUTF8_off(sv);
2816 }
2817
2818 /*
2819 =for apidoc sv_utf8_decode
2820
2821 If the PV of the SV is an octet sequence in UTF-8
2822 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
2823 so that it looks like a character. If the PV contains only single-byte
2824 characters, the C<SvUTF8> flag stays being off.
2825 Scans PV for validity and returns false if the PV is invalid UTF-8.
2826
2827 =cut
2828 */
2829
2830 bool
2831 Perl_sv_utf8_decode(pTHX_ register SV *sv)
2832 {
2833     if (SvPOKp(sv)) {
2834         const U8 *c;
2835         const U8 *e;
2836
2837         /* The octets may have got themselves encoded - get them back as
2838          * bytes
2839          */
2840         if (!sv_utf8_downgrade(sv, TRUE))
2841             return FALSE;
2842
2843         /* it is actually just a matter of turning the utf8 flag on, but
2844          * we want to make sure everything inside is valid utf8 first.
2845          */
2846         c = (const U8 *) SvPVX_const(sv);
2847         if (!is_utf8_string(c, SvCUR(sv)+1))
2848             return FALSE;
2849         e = (const U8 *) SvEND(sv);
2850         while (c < e) {
2851             const U8 ch = *c++;
2852             if (!UTF8_IS_INVARIANT(ch)) {
2853                 SvUTF8_on(sv);
2854                 break;
2855             }
2856         }
2857     }
2858     return TRUE;
2859 }
2860
2861 /*
2862 =for apidoc sv_setsv
2863
2864 Copies the contents of the source SV C<ssv> into the destination SV
2865 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2866 function if the source SV needs to be reused. Does not handle 'set' magic.
2867 Loosely speaking, it performs a copy-by-value, obliterating any previous
2868 content of the destination.
2869
2870 You probably want to use one of the assortment of wrappers, such as
2871 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2872 C<SvSetMagicSV_nosteal>.
2873
2874 =for apidoc sv_setsv_flags
2875
2876 Copies the contents of the source SV C<ssv> into the destination SV
2877 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2878 function if the source SV needs to be reused. Does not handle 'set' magic.
2879 Loosely speaking, it performs a copy-by-value, obliterating any previous
2880 content of the destination.
2881 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
2882 C<ssv> if appropriate, else not. If the C<flags> parameter has the
2883 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
2884 and C<sv_setsv_nomg> are implemented in terms of this function.
2885
2886 You probably want to use one of the assortment of wrappers, such as
2887 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2888 C<SvSetMagicSV_nosteal>.
2889
2890 This is the primary function for copying scalars, and most other
2891 copy-ish functions and macros use this underneath.
2892
2893 =cut
2894 */
2895
2896 void
2897 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
2898 {
2899     register U32 sflags;
2900     register int dtype;
2901     register int stype;
2902
2903     if (sstr == dstr)
2904         return;
2905     SV_CHECK_THINKFIRST_COW_DROP(dstr);
2906     if (!sstr)
2907         sstr = &PL_sv_undef;
2908     stype = SvTYPE(sstr);
2909     dtype = SvTYPE(dstr);
2910
2911     SvAMAGIC_off(dstr);
2912     if ( SvVOK(dstr) )
2913     {
2914         /* need to nuke the magic */
2915         mg_free(dstr);
2916         SvRMAGICAL_off(dstr);
2917     }
2918
2919     /* There's a lot of redundancy below but we're going for speed here */
2920
2921     switch (stype) {
2922     case SVt_NULL:
2923       undef_sstr:
2924         if (dtype != SVt_PVGV) {
2925             (void)SvOK_off(dstr);
2926             return;
2927         }
2928         break;
2929     case SVt_IV:
2930         if (SvIOK(sstr)) {
2931             switch (dtype) {
2932             case SVt_NULL:
2933                 sv_upgrade(dstr, SVt_IV);
2934                 break;
2935             case SVt_NV:
2936                 sv_upgrade(dstr, SVt_PVNV);
2937                 break;
2938             case SVt_RV:
2939             case SVt_PV:
2940                 sv_upgrade(dstr, SVt_PVIV);
2941                 break;
2942             }
2943             (void)SvIOK_only(dstr);
2944             SvIV_set(dstr,  SvIVX(sstr));
2945             if (SvIsUV(sstr))
2946                 SvIsUV_on(dstr);
2947             if (SvTAINTED(sstr))
2948                 SvTAINT(dstr);
2949             return;
2950         }
2951         goto undef_sstr;
2952
2953     case SVt_NV:
2954         if (SvNOK(sstr)) {
2955             switch (dtype) {
2956             case SVt_NULL:
2957             case SVt_IV:
2958                 sv_upgrade(dstr, SVt_NV);
2959                 break;
2960             case SVt_RV:
2961             case SVt_PV:
2962             case SVt_PVIV:
2963                 sv_upgrade(dstr, SVt_PVNV);
2964                 break;
2965             }
2966             SvNV_set(dstr, SvNVX(sstr));
2967             (void)SvNOK_only(dstr);
2968             if (SvTAINTED(sstr))
2969                 SvTAINT(dstr);
2970             return;
2971         }
2972         goto undef_sstr;
2973
2974     case SVt_RV:
2975         if (dtype < SVt_RV)
2976             sv_upgrade(dstr, SVt_RV);
2977         else if (dtype == SVt_PVGV &&
2978                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
2979             sstr = SvRV(sstr);
2980             if (sstr == dstr) {
2981                 if (GvIMPORTED(dstr) != GVf_IMPORTED
2982                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
2983                 {
2984                     GvIMPORTED_on(dstr);
2985                 }
2986                 GvMULTI_on(dstr);
2987                 return;
2988             }
2989             goto glob_assign;
2990         }
2991         break;
2992     case SVt_PVFM:
2993 #ifdef PERL_OLD_COPY_ON_WRITE
2994         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
2995             if (dtype < SVt_PVIV)
2996                 sv_upgrade(dstr, SVt_PVIV);
2997             break;
2998         }
2999         /* Fall through */
3000 #endif
3001     case SVt_PV:
3002         if (dtype < SVt_PV)
3003             sv_upgrade(dstr, SVt_PV);
3004         break;
3005     case SVt_PVIV:
3006         if (dtype < SVt_PVIV)
3007             sv_upgrade(dstr, SVt_PVIV);
3008         break;
3009     case SVt_PVNV:
3010         if (dtype < SVt_PVNV)
3011             sv_upgrade(dstr, SVt_PVNV);
3012         break;
3013     case SVt_PVAV:
3014     case SVt_PVHV:
3015     case SVt_PVCV:
3016     case SVt_PVIO:
3017         {
3018         const char * const type = sv_reftype(sstr,0);
3019         if (PL_op)
3020             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3021         else
3022             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3023         }
3024         break;
3025
3026     case SVt_PVGV:
3027         if (dtype <= SVt_PVGV) {
3028   glob_assign:
3029             if (dtype != SVt_PVGV) {
3030                 const char * const name = GvNAME(sstr);
3031                 const STRLEN len = GvNAMELEN(sstr);
3032                 /* don't upgrade SVt_PVLV: it can hold a glob */
3033                 if (dtype != SVt_PVLV)
3034                     sv_upgrade(dstr, SVt_PVGV);
3035                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3036                 GvSTASH(dstr) = GvSTASH(sstr);
3037                 if (GvSTASH(dstr))
3038                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3039                 GvNAME(dstr) = savepvn(name, len);
3040                 GvNAMELEN(dstr) = len;
3041                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3042             }
3043
3044 #ifdef GV_UNIQUE_CHECK
3045                 if (GvUNIQUE((GV*)dstr)) {
3046                     Perl_croak(aTHX_ PL_no_modify);
3047                 }
3048 #endif
3049
3050             (void)SvOK_off(dstr);
3051             GvINTRO_off(dstr);          /* one-shot flag */
3052             gp_free((GV*)dstr);
3053             GvGP(dstr) = gp_ref(GvGP(sstr));
3054             if (SvTAINTED(sstr))
3055                 SvTAINT(dstr);
3056             if (GvIMPORTED(dstr) != GVf_IMPORTED
3057                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3058             {
3059                 GvIMPORTED_on(dstr);
3060             }
3061             GvMULTI_on(dstr);
3062             return;
3063         }
3064         /* FALL THROUGH */
3065
3066     default:
3067         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3068             mg_get(sstr);
3069             if ((int)SvTYPE(sstr) != stype) {
3070                 stype = SvTYPE(sstr);
3071                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3072                     goto glob_assign;
3073             }
3074         }
3075         if (stype == SVt_PVLV)
3076             SvUPGRADE(dstr, SVt_PVNV);
3077         else
3078             SvUPGRADE(dstr, (U32)stype);
3079     }
3080
3081     sflags = SvFLAGS(sstr);
3082
3083     if (sflags & SVf_ROK) {
3084         if (dtype >= SVt_PV) {
3085             if (dtype == SVt_PVGV) {
3086                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3087                 SV *dref = 0;
3088                 const int intro = GvINTRO(dstr);
3089
3090 #ifdef GV_UNIQUE_CHECK
3091                 if (GvUNIQUE((GV*)dstr)) {
3092                     Perl_croak(aTHX_ PL_no_modify);
3093                 }
3094 #endif
3095
3096                 if (intro) {
3097                     GvINTRO_off(dstr);  /* one-shot flag */
3098                     GvLINE(dstr) = CopLINE(PL_curcop);
3099                     GvEGV(dstr) = (GV*)dstr;
3100                 }
3101                 GvMULTI_on(dstr);
3102                 switch (SvTYPE(sref)) {
3103                 case SVt_PVAV:
3104                     if (intro)
3105                         SAVEGENERICSV(GvAV(dstr));
3106                     else
3107                         dref = (SV*)GvAV(dstr);
3108                     GvAV(dstr) = (AV*)sref;
3109                     if (!GvIMPORTED_AV(dstr)
3110                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3111                     {
3112                         GvIMPORTED_AV_on(dstr);
3113                     }
3114                     break;
3115                 case SVt_PVHV:
3116                     if (intro)
3117                         SAVEGENERICSV(GvHV(dstr));
3118                     else
3119                         dref = (SV*)GvHV(dstr);
3120                     GvHV(dstr) = (HV*)sref;
3121                     if (!GvIMPORTED_HV(dstr)
3122                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3123                     {
3124                         GvIMPORTED_HV_on(dstr);
3125                     }
3126                     break;
3127                 case SVt_PVCV:
3128                     if (intro) {
3129                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3130                             SvREFCNT_dec(GvCV(dstr));
3131                             GvCV(dstr) = Nullcv;
3132                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3133                             PL_sub_generation++;
3134                         }
3135                         SAVEGENERICSV(GvCV(dstr));
3136                     }
3137                     else
3138                         dref = (SV*)GvCV(dstr);
3139                     if (GvCV(dstr) != (CV*)sref) {
3140                         CV* const cv = GvCV(dstr);
3141                         if (cv) {
3142                             if (!GvCVGEN((GV*)dstr) &&
3143                                 (CvROOT(cv) || CvXSUB(cv)))
3144                             {
3145                                 /* Redefining a sub - warning is mandatory if
3146                                    it was a const and its value changed. */
3147                                 if (ckWARN(WARN_REDEFINE)
3148                                     || (CvCONST(cv)
3149                                         && (!CvCONST((CV*)sref)
3150                                             || sv_cmp(cv_const_sv(cv),
3151                                                       cv_const_sv((CV*)sref)))))
3152                                 {
3153                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3154                                         CvCONST(cv)
3155                                         ? "Constant subroutine %s::%s redefined"
3156                                         : "Subroutine %s::%s redefined",
3157                                         HvNAME_get(GvSTASH((GV*)dstr)),
3158                                         GvENAME((GV*)dstr));
3159                                 }
3160                             }
3161                             if (!intro)
3162                                 cv_ckproto(cv, (GV*)dstr,
3163                                            SvPOK(sref)
3164                                            ? SvPVX_const(sref) : Nullch);
3165                         }
3166                         GvCV(dstr) = (CV*)sref;
3167                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3168                         GvASSUMECV_on(dstr);
3169                         PL_sub_generation++;
3170                     }
3171                     if (!GvIMPORTED_CV(dstr)
3172                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3173                     {
3174                         GvIMPORTED_CV_on(dstr);
3175                     }
3176                     break;
3177                 case SVt_PVIO:
3178                     if (intro)
3179                         SAVEGENERICSV(GvIOp(dstr));
3180                     else
3181                         dref = (SV*)GvIOp(dstr);
3182                     GvIOp(dstr) = (IO*)sref;
3183                     break;
3184                 case SVt_PVFM:
3185                     if (intro)
3186                         SAVEGENERICSV(GvFORM(dstr));
3187                     else
3188                         dref = (SV*)GvFORM(dstr);
3189                     GvFORM(dstr) = (CV*)sref;
3190                     break;
3191                 default:
3192                     if (intro)
3193                         SAVEGENERICSV(GvSV(dstr));
3194                     else
3195                         dref = (SV*)GvSV(dstr);
3196                     GvSV(dstr) = sref;
3197                     if (!GvIMPORTED_SV(dstr)
3198                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3199                     {
3200                         GvIMPORTED_SV_on(dstr);
3201                     }
3202                     break;
3203                 }
3204                 if (dref)
3205                     SvREFCNT_dec(dref);
3206                 if (SvTAINTED(sstr))
3207                     SvTAINT(dstr);
3208                 return;
3209             }
3210             if (SvPVX_const(dstr)) {
3211                 SvPV_free(dstr);
3212                 SvLEN_set(dstr, 0);
3213                 SvCUR_set(dstr, 0);
3214             }
3215         }
3216         (void)SvOK_off(dstr);
3217         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3218         SvROK_on(dstr);
3219         if (sflags & SVp_NOK) {
3220             SvNOKp_on(dstr);
3221             /* Only set the public OK flag if the source has public OK.  */
3222             if (sflags & SVf_NOK)
3223                 SvFLAGS(dstr) |= SVf_NOK;
3224             SvNV_set(dstr, SvNVX(sstr));
3225         }
3226         if (sflags & SVp_IOK) {
3227             (void)SvIOKp_on(dstr);
3228             if (sflags & SVf_IOK)
3229                 SvFLAGS(dstr) |= SVf_IOK;
3230             if (sflags & SVf_IVisUV)
3231                 SvIsUV_on(dstr);
3232             SvIV_set(dstr, SvIVX(sstr));
3233         }
3234         if (SvAMAGIC(sstr)) {
3235             SvAMAGIC_on(dstr);
3236         }
3237     }
3238     else if (sflags & SVp_POK) {
3239         bool isSwipe = 0;
3240
3241         /*
3242          * Check to see if we can just swipe the string.  If so, it's a
3243          * possible small lose on short strings, but a big win on long ones.
3244          * It might even be a win on short strings if SvPVX_const(dstr)
3245          * has to be allocated and SvPVX_const(sstr) has to be freed.
3246          */
3247
3248         /* Whichever path we take through the next code, we want this true,
3249            and doing it now facilitates the COW check.  */
3250         (void)SvPOK_only(dstr);
3251
3252         if (
3253             /* We're not already COW  */
3254             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3255 #ifndef PERL_OLD_COPY_ON_WRITE
3256              /* or we are, but dstr isn't a suitable target.  */
3257              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3258 #endif
3259              )
3260             &&
3261             !(isSwipe =
3262                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3263                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3264                  (!(flags & SV_NOSTEAL)) &&
3265                                         /* and we're allowed to steal temps */
3266                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3267                  SvLEN(sstr)    &&        /* and really is a string */
3268                                 /* and won't be needed again, potentially */
3269               !(PL_op && PL_op->op_type == OP_AASSIGN))
3270 #ifdef PERL_OLD_COPY_ON_WRITE
3271             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3272                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3273                  && SvTYPE(sstr) >= SVt_PVIV)
3274 #endif
3275             ) {
3276             /* Failed the swipe test, and it's not a shared hash key either.
3277                Have to copy the string.  */
3278             STRLEN len = SvCUR(sstr);
3279             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3280             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3281             SvCUR_set(dstr, len);
3282             *SvEND(dstr) = '\0';
3283         } else {
3284             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3285                be true in here.  */
3286             /* Either it's a shared hash key, or it's suitable for
3287                copy-on-write or we can swipe the string.  */
3288             if (DEBUG_C_TEST) {
3289                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3290                 sv_dump(sstr);
3291                 sv_dump(dstr);
3292             }
3293 #ifdef PERL_OLD_COPY_ON_WRITE
3294             if (!isSwipe) {
3295                 /* I believe I should acquire a global SV mutex if
3296                    it's a COW sv (not a shared hash key) to stop
3297                    it going un copy-on-write.
3298                    If the source SV has gone un copy on write between up there
3299                    and down here, then (assert() that) it is of the correct
3300                    form to make it copy on write again */
3301                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3302                     != (SVf_FAKE | SVf_READONLY)) {
3303                     SvREADONLY_on(sstr);
3304                     SvFAKE_on(sstr);
3305                     /* Make the source SV into a loop of 1.
3306                        (about to become 2) */
3307                     SV_COW_NEXT_SV_SET(sstr, sstr);
3308                 }
3309             }
3310 #endif
3311             /* Initial code is common.  */
3312             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3313                 SvPV_free(dstr);
3314             }
3315
3316             if (!isSwipe) {
3317                 /* making another shared SV.  */
3318                 STRLEN cur = SvCUR(sstr);
3319                 STRLEN len = SvLEN(sstr);
3320 #ifdef PERL_OLD_COPY_ON_WRITE
3321                 if (len) {
3322                     assert (SvTYPE(dstr) >= SVt_PVIV);
3323                     /* SvIsCOW_normal */
3324                     /* splice us in between source and next-after-source.  */
3325                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3326                     SV_COW_NEXT_SV_SET(sstr, dstr);
3327                     SvPV_set(dstr, SvPVX_mutable(sstr));
3328                 } else
3329 #endif
3330                 {
3331                     /* SvIsCOW_shared_hash */
3332                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3333                                           "Copy on write: Sharing hash\n"));
3334
3335                     assert (SvTYPE(dstr) >= SVt_PV);
3336                     SvPV_set(dstr,
3337                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3338                 }
3339                 SvLEN_set(dstr, len);
3340                 SvCUR_set(dstr, cur);
3341                 SvREADONLY_on(dstr);
3342                 SvFAKE_on(dstr);
3343                 /* Relesase a global SV mutex.  */
3344             }
3345             else
3346                 {       /* Passes the swipe test.  */
3347                 SvPV_set(dstr, SvPVX_mutable(sstr));
3348                 SvLEN_set(dstr, SvLEN(sstr));
3349                 SvCUR_set(dstr, SvCUR(sstr));
3350
3351                 SvTEMP_off(dstr);
3352                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3353                 SvPV_set(sstr, Nullch);
3354                 SvLEN_set(sstr, 0);
3355                 SvCUR_set(sstr, 0);
3356                 SvTEMP_off(sstr);
3357             }
3358         }
3359         if (sflags & SVf_UTF8)
3360             SvUTF8_on(dstr);
3361         if (sflags & SVp_NOK) {
3362             SvNOKp_on(dstr);
3363             if (sflags & SVf_NOK)
3364                 SvFLAGS(dstr) |= SVf_NOK;
3365             SvNV_set(dstr, SvNVX(sstr));
3366         }
3367         if (sflags & SVp_IOK) {
3368             (void)SvIOKp_on(dstr);
3369             if (sflags & SVf_IOK)
3370                 SvFLAGS(dstr) |= SVf_IOK;
3371             if (sflags & SVf_IVisUV)
3372                 SvIsUV_on(dstr);
3373             SvIV_set(dstr, SvIVX(sstr));
3374         }
3375         if (SvVOK(sstr)) {
3376             const MAGIC * const smg = mg_find(sstr,PERL_MAGIC_vstring);
3377             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3378                         smg->mg_ptr, smg->mg_len);
3379             SvRMAGICAL_on(dstr);
3380         }
3381     }
3382     else if (sflags & SVp_IOK) {
3383         if (sflags & SVf_IOK)
3384             (void)SvIOK_only(dstr);
3385         else {
3386             (void)SvOK_off(dstr);
3387             (void)SvIOKp_on(dstr);
3388         }
3389         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3390         if (sflags & SVf_IVisUV)
3391             SvIsUV_on(dstr);
3392         SvIV_set(dstr, SvIVX(sstr));
3393         if (sflags & SVp_NOK) {
3394             if (sflags & SVf_NOK)
3395                 (void)SvNOK_on(dstr);
3396             else
3397                 (void)SvNOKp_on(dstr);
3398             SvNV_set(dstr, SvNVX(sstr));
3399         }
3400     }
3401     else if (sflags & SVp_NOK) {
3402         if (sflags & SVf_NOK)
3403             (void)SvNOK_only(dstr);
3404         else {
3405             (void)SvOK_off(dstr);
3406             SvNOKp_on(dstr);
3407         }
3408         SvNV_set(dstr, SvNVX(sstr));
3409     }
3410     else {
3411         if (dtype == SVt_PVGV) {
3412             if (ckWARN(WARN_MISC))
3413                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3414         }
3415         else
3416             (void)SvOK_off(dstr);
3417     }
3418     if (SvTAINTED(sstr))
3419         SvTAINT(dstr);
3420 }
3421
3422 /*
3423 =for apidoc sv_setsv_mg
3424
3425 Like C<sv_setsv>, but also handles 'set' magic.
3426
3427 =cut
3428 */
3429
3430 void
3431 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3432 {
3433     sv_setsv(dstr,sstr);
3434     SvSETMAGIC(dstr);
3435 }
3436
3437 #ifdef PERL_OLD_COPY_ON_WRITE
3438 SV *
3439 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3440 {
3441     STRLEN cur = SvCUR(sstr);
3442     STRLEN len = SvLEN(sstr);
3443     register char *new_pv;
3444
3445     if (DEBUG_C_TEST) {
3446         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3447                       sstr, dstr);
3448         sv_dump(sstr);
3449         if (dstr)
3450                     sv_dump(dstr);
3451     }
3452
3453     if (dstr) {
3454         if (SvTHINKFIRST(dstr))
3455             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3456         else if (SvPVX_const(dstr))
3457             Safefree(SvPVX_const(dstr));
3458     }
3459     else
3460         new_SV(dstr);
3461     SvUPGRADE(dstr, SVt_PVIV);
3462
3463     assert (SvPOK(sstr));
3464     assert (SvPOKp(sstr));
3465     assert (!SvIOK(sstr));
3466     assert (!SvIOKp(sstr));
3467     assert (!SvNOK(sstr));
3468     assert (!SvNOKp(sstr));
3469
3470     if (SvIsCOW(sstr)) {
3471
3472         if (SvLEN(sstr) == 0) {
3473             /* source is a COW shared hash key.  */
3474             DEBUG_C(PerlIO_printf(Perl_debug_log,
3475                                   "Fast copy on write: Sharing hash\n"));
3476             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3477             goto common_exit;
3478         }
3479         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3480     } else {
3481         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3482         SvUPGRADE(sstr, SVt_PVIV);
3483         SvREADONLY_on(sstr);
3484         SvFAKE_on(sstr);
3485         DEBUG_C(PerlIO_printf(Perl_debug_log,
3486                               "Fast copy on write: Converting sstr to COW\n"));
3487         SV_COW_NEXT_SV_SET(dstr, sstr);
3488     }
3489     SV_COW_NEXT_SV_SET(sstr, dstr);
3490     new_pv = SvPVX_mutable(sstr);
3491
3492   common_exit:
3493     SvPV_set(dstr, new_pv);
3494     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3495     if (SvUTF8(sstr))
3496         SvUTF8_on(dstr);
3497     SvLEN_set(dstr, len);
3498     SvCUR_set(dstr, cur);
3499     if (DEBUG_C_TEST) {
3500         sv_dump(dstr);
3501     }
3502     return dstr;
3503 }
3504 #endif
3505
3506 /*
3507 =for apidoc sv_setpvn
3508
3509 Copies a string into an SV.  The C<len> parameter indicates the number of
3510 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3511 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3512
3513 =cut
3514 */
3515
3516 void
3517 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3518 {
3519     register char *dptr;
3520
3521     SV_CHECK_THINKFIRST_COW_DROP(sv);
3522     if (!ptr) {
3523         (void)SvOK_off(sv);
3524         return;
3525     }
3526     else {
3527         /* len is STRLEN which is unsigned, need to copy to signed */
3528         const IV iv = len;
3529         if (iv < 0)
3530             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3531     }
3532     SvUPGRADE(sv, SVt_PV);
3533
3534     dptr = SvGROW(sv, len + 1);
3535     Move(ptr,dptr,len,char);
3536     dptr[len] = '\0';
3537     SvCUR_set(sv, len);
3538     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3539     SvTAINT(sv);
3540 }
3541
3542 /*
3543 =for apidoc sv_setpvn_mg
3544
3545 Like C<sv_setpvn>, but also handles 'set' magic.
3546
3547 =cut
3548 */
3549
3550 void
3551 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3552 {
3553     sv_setpvn(sv,ptr,len);
3554     SvSETMAGIC(sv);
3555 }
3556
3557 /*
3558 =for apidoc sv_setpv
3559
3560 Copies a string into an SV.  The string must be null-terminated.  Does not
3561 handle 'set' magic.  See C<sv_setpv_mg>.
3562
3563 =cut
3564 */
3565
3566 void
3567 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3568 {
3569     register STRLEN len;
3570
3571     SV_CHECK_THINKFIRST_COW_DROP(sv);
3572     if (!ptr) {
3573         (void)SvOK_off(sv);
3574         return;
3575     }
3576     len = strlen(ptr);
3577     SvUPGRADE(sv, SVt_PV);
3578
3579     SvGROW(sv, len + 1);
3580     Move(ptr,SvPVX(sv),len+1,char);
3581     SvCUR_set(sv, len);
3582     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3583     SvTAINT(sv);
3584 }
3585
3586 /*
3587 =for apidoc sv_setpv_mg
3588
3589 Like C<sv_setpv>, but also handles 'set' magic.
3590
3591 =cut
3592 */
3593
3594 void
3595 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3596 {
3597     sv_setpv(sv,ptr);
3598     SvSETMAGIC(sv);
3599 }
3600
3601 /*
3602 =for apidoc sv_usepvn
3603
3604 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3605 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3606 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3607 string length, C<len>, must be supplied.  This function will realloc the
3608 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3609 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3610 See C<sv_usepvn_mg>.
3611
3612 =cut
3613 */
3614
3615 void
3616 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3617 {
3618     STRLEN allocate;
3619     SV_CHECK_THINKFIRST_COW_DROP(sv);
3620     SvUPGRADE(sv, SVt_PV);
3621     if (!ptr) {
3622         (void)SvOK_off(sv);
3623         return;
3624     }
3625     if (SvPVX_const(sv))
3626         SvPV_free(sv);
3627
3628     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3629     ptr = saferealloc (ptr, allocate);
3630     SvPV_set(sv, ptr);
3631     SvCUR_set(sv, len);
3632     SvLEN_set(sv, allocate);
3633     *SvEND(sv) = '\0';
3634     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3635     SvTAINT(sv);
3636 }
3637
3638 /*
3639 =for apidoc sv_usepvn_mg
3640
3641 Like C<sv_usepvn>, but also handles 'set' magic.
3642
3643 =cut
3644 */
3645
3646 void
3647 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3648 {
3649     sv_usepvn(sv,ptr,len);
3650     SvSETMAGIC(sv);
3651 }
3652
3653 #ifdef PERL_OLD_COPY_ON_WRITE
3654 /* Need to do this *after* making the SV normal, as we need the buffer
3655    pointer to remain valid until after we've copied it.  If we let go too early,
3656    another thread could invalidate it by unsharing last of the same hash key
3657    (which it can do by means other than releasing copy-on-write Svs)
3658    or by changing the other copy-on-write SVs in the loop.  */
3659 STATIC void
3660 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3661 {
3662     if (len) { /* this SV was SvIsCOW_normal(sv) */
3663          /* we need to find the SV pointing to us.  */
3664         SV * const current = SV_COW_NEXT_SV(after);
3665
3666         if (current == sv) {
3667             /* The SV we point to points back to us (there were only two of us
3668                in the loop.)
3669                Hence other SV is no longer copy on write either.  */
3670             SvFAKE_off(after);
3671             SvREADONLY_off(after);
3672         } else {
3673             /* We need to follow the pointers around the loop.  */
3674             SV *next;
3675             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3676                 assert (next);
3677                 current = next;
3678                  /* don't loop forever if the structure is bust, and we have
3679                     a pointer into a closed loop.  */
3680                 assert (current != after);
3681                 assert (SvPVX_const(current) == pvx);
3682             }
3683             /* Make the SV before us point to the SV after us.  */
3684             SV_COW_NEXT_SV_SET(current, after);
3685         }
3686     } else {
3687         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3688     }
3689 }
3690
3691 int
3692 Perl_sv_release_IVX(pTHX_ register SV *sv)
3693 {
3694     if (SvIsCOW(sv))
3695         sv_force_normal_flags(sv, 0);
3696     SvOOK_off(sv);
3697     return 0;
3698 }
3699 #endif
3700 /*
3701 =for apidoc sv_force_normal_flags
3702
3703 Undo various types of fakery on an SV: if the PV is a shared string, make
3704 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3705 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3706 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3707 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3708 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3709 set to some other value.) In addition, the C<flags> parameter gets passed to
3710 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3711 with flags set to 0.
3712
3713 =cut
3714 */
3715
3716 void
3717 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3718 {
3719 #ifdef PERL_OLD_COPY_ON_WRITE
3720     if (SvREADONLY(sv)) {
3721         /* At this point I believe I should acquire a global SV mutex.  */
3722         if (SvFAKE(sv)) {
3723             const char * const pvx = SvPVX_const(sv);
3724             const STRLEN len = SvLEN(sv);
3725             const STRLEN cur = SvCUR(sv);
3726             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3727             if (DEBUG_C_TEST) {
3728                 PerlIO_printf(Perl_debug_log,
3729                               "Copy on write: Force normal %ld\n",
3730                               (long) flags);
3731                 sv_dump(sv);
3732             }
3733             SvFAKE_off(sv);
3734             SvREADONLY_off(sv);
3735             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3736             SvPV_set(sv, (char*)0);
3737             SvLEN_set(sv, 0);
3738             if (flags & SV_COW_DROP_PV) {
3739                 /* OK, so we don't need to copy our buffer.  */
3740                 SvPOK_off(sv);
3741             } else {
3742                 SvGROW(sv, cur + 1);
3743                 Move(pvx,SvPVX(sv),cur,char);
3744                 SvCUR_set(sv, cur);
3745                 *SvEND(sv) = '\0';
3746             }
3747             sv_release_COW(sv, pvx, len, next);
3748             if (DEBUG_C_TEST) {
3749                 sv_dump(sv);
3750             }
3751         }
3752         else if (IN_PERL_RUNTIME)
3753             Perl_croak(aTHX_ PL_no_modify);
3754         /* At this point I believe that I can drop the global SV mutex.  */
3755     }
3756 #else
3757     if (SvREADONLY(sv)) {
3758         if (SvFAKE(sv)) {
3759             const char * const pvx = SvPVX_const(sv);
3760             const STRLEN len = SvCUR(sv);
3761             SvFAKE_off(sv);
3762             SvREADONLY_off(sv);
3763             SvPV_set(sv, Nullch);
3764             SvLEN_set(sv, 0);
3765             SvGROW(sv, len + 1);
3766             Move(pvx,SvPVX(sv),len,char);
3767             *SvEND(sv) = '\0';
3768             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3769         }
3770         else if (IN_PERL_RUNTIME)
3771             Perl_croak(aTHX_ PL_no_modify);
3772     }
3773 #endif
3774     if (SvROK(sv))
3775         sv_unref_flags(sv, flags);
3776     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
3777         sv_unglob(sv);
3778 }
3779
3780 /*
3781 =for apidoc sv_chop
3782
3783 Efficient removal of characters from the beginning of the string buffer.
3784 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
3785 the string buffer.  The C<ptr> becomes the first character of the adjusted
3786 string. Uses the "OOK hack".
3787 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
3788 refer to the same chunk of data.
3789
3790 =cut
3791 */
3792
3793 void
3794 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
3795 {
3796     register STRLEN delta;
3797     if (!ptr || !SvPOKp(sv))
3798         return;
3799     delta = ptr - SvPVX_const(sv);
3800     SV_CHECK_THINKFIRST(sv);
3801     if (SvTYPE(sv) < SVt_PVIV)
3802         sv_upgrade(sv,SVt_PVIV);
3803
3804     if (!SvOOK(sv)) {
3805         if (!SvLEN(sv)) { /* make copy of shared string */
3806             const char *pvx = SvPVX_const(sv);
3807             const STRLEN len = SvCUR(sv);
3808             SvGROW(sv, len + 1);
3809             Move(pvx,SvPVX(sv),len,char);
3810             *SvEND(sv) = '\0';
3811         }
3812         SvIV_set(sv, 0);
3813         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
3814            and we do that anyway inside the SvNIOK_off
3815         */
3816         SvFLAGS(sv) |= SVf_OOK;
3817     }
3818     SvNIOK_off(sv);
3819     SvLEN_set(sv, SvLEN(sv) - delta);
3820     SvCUR_set(sv, SvCUR(sv) - delta);
3821     SvPV_set(sv, SvPVX(sv) + delta);
3822     SvIV_set(sv, SvIVX(sv) + delta);
3823 }
3824
3825 /*
3826 =for apidoc sv_catpvn
3827
3828 Concatenates the string onto the end of the string which is in the SV.  The
3829 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3830 status set, then the bytes appended should be valid UTF-8.
3831 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
3832
3833 =for apidoc sv_catpvn_flags
3834
3835 Concatenates the string onto the end of the string which is in the SV.  The
3836 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3837 status set, then the bytes appended should be valid UTF-8.
3838 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
3839 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
3840 in terms of this function.
3841
3842 =cut
3843 */
3844
3845 void
3846 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
3847 {
3848     STRLEN dlen;
3849     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
3850
3851     SvGROW(dsv, dlen + slen + 1);
3852     if (sstr == dstr)
3853         sstr = SvPVX_const(dsv);
3854     Move(sstr, SvPVX(dsv) + dlen, slen, char);
3855     SvCUR_set(dsv, SvCUR(dsv) + slen);
3856     *SvEND(dsv) = '\0';
3857     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
3858     SvTAINT(dsv);
3859     if (flags & SV_SMAGIC)
3860         SvSETMAGIC(dsv);
3861 }
3862
3863 /*
3864 =for apidoc sv_catsv
3865
3866 Concatenates the string from SV C<ssv> onto the end of the string in
3867 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
3868 not 'set' magic.  See C<sv_catsv_mg>.
3869
3870 =for apidoc sv_catsv_flags
3871
3872 Concatenates the string from SV C<ssv> onto the end of the string in
3873 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
3874 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
3875 and C<sv_catsv_nomg> are implemented in terms of this function.
3876
3877 =cut */
3878
3879 void
3880 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
3881 {
3882     if (ssv) {
3883         STRLEN slen;
3884         const char *spv = SvPV_const(ssv, slen);
3885         if (spv) {
3886             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
3887                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
3888                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
3889                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
3890                 dsv->sv_flags doesn't have that bit set.
3891                 Andy Dougherty  12 Oct 2001
3892             */
3893             const I32 sutf8 = DO_UTF8(ssv);
3894             I32 dutf8;
3895
3896             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
3897                 mg_get(dsv);
3898             dutf8 = DO_UTF8(dsv);
3899
3900             if (dutf8 != sutf8) {
3901                 if (dutf8) {
3902                     /* Not modifying source SV, so taking a temporary copy. */
3903                     SV* const csv = sv_2mortal(newSVpvn(spv, slen));
3904
3905                     sv_utf8_upgrade(csv);
3906                     spv = SvPV_const(csv, slen);
3907                 }
3908                 else
3909                     sv_utf8_upgrade_nomg(dsv);
3910             }
3911             sv_catpvn_nomg(dsv, spv, slen);
3912         }
3913     }
3914     if (flags & SV_SMAGIC)
3915         SvSETMAGIC(dsv);
3916 }
3917
3918 /*
3919 =for apidoc sv_catpv
3920
3921 Concatenates the string onto the end of the string which is in the SV.
3922 If the SV has the UTF-8 status set, then the bytes appended should be
3923 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
3924
3925 =cut */
3926
3927 void
3928 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
3929 {
3930     register STRLEN len;
3931     STRLEN tlen;
3932     char *junk;
3933
3934     if (!ptr)
3935         return;
3936     junk = SvPV_force(sv, tlen);
3937     len = strlen(ptr);
3938     SvGROW(sv, tlen + len + 1);
3939     if (ptr == junk)
3940         ptr = SvPVX_const(sv);
3941     Move(ptr,SvPVX(sv)+tlen,len+1,char);
3942     SvCUR_set(sv, SvCUR(sv) + len);
3943     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3944     SvTAINT(sv);
3945 }
3946
3947 /*
3948 =for apidoc sv_catpv_mg
3949
3950 Like C<sv_catpv>, but also handles 'set' magic.
3951
3952 =cut
3953 */
3954
3955 void
3956 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
3957 {
3958     sv_catpv(sv,ptr);
3959     SvSETMAGIC(sv);
3960 }
3961
3962 /*
3963 =for apidoc newSV
3964
3965 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
3966 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
3967 macro.
3968
3969 =cut
3970 */
3971
3972 SV *
3973 Perl_newSV(pTHX_ STRLEN len)
3974 {
3975     register SV *sv;
3976
3977     new_SV(sv);
3978     if (len) {
3979         sv_upgrade(sv, SVt_PV);
3980         SvGROW(sv, len + 1);
3981     }
3982     return sv;
3983 }
3984 /*
3985 =for apidoc sv_magicext
3986
3987 Adds magic to an SV, upgrading it if necessary. Applies the
3988 supplied vtable and returns a pointer to the magic added.
3989
3990 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
3991 In particular, you can add magic to SvREADONLY SVs, and add more than
3992 one instance of the same 'how'.
3993
3994 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
3995 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
3996 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
3997 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
3998
3999 (This is now used as a subroutine by C<sv_magic>.)
4000
4001 =cut
4002 */
4003 MAGIC * 
4004 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4005                  const char* name, I32 namlen)
4006 {
4007     MAGIC* mg;
4008
4009     if (SvTYPE(sv) < SVt_PVMG) {
4010         SvUPGRADE(sv, SVt_PVMG);
4011     }
4012     Newxz(mg, 1, MAGIC);
4013     mg->mg_moremagic = SvMAGIC(sv);
4014     SvMAGIC_set(sv, mg);
4015
4016     /* Sometimes a magic contains a reference loop, where the sv and
4017        object refer to each other.  To prevent a reference loop that
4018        would prevent such objects being freed, we look for such loops
4019        and if we find one we avoid incrementing the object refcount.
4020
4021        Note we cannot do this to avoid self-tie loops as intervening RV must
4022        have its REFCNT incremented to keep it in existence.
4023
4024     */
4025     if (!obj || obj == sv ||
4026         how == PERL_MAGIC_arylen ||
4027         how == PERL_MAGIC_qr ||
4028         how == PERL_MAGIC_symtab ||
4029         (SvTYPE(obj) == SVt_PVGV &&
4030             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4031             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4032             GvFORM(obj) == (CV*)sv)))
4033     {
4034         mg->mg_obj = obj;
4035     }
4036     else {
4037         mg->mg_obj = SvREFCNT_inc(obj);
4038         mg->mg_flags |= MGf_REFCOUNTED;
4039     }
4040
4041     /* Normal self-ties simply pass a null object, and instead of
4042        using mg_obj directly, use the SvTIED_obj macro to produce a
4043        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4044        with an RV obj pointing to the glob containing the PVIO.  In
4045        this case, to avoid a reference loop, we need to weaken the
4046        reference.
4047     */
4048
4049     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4050         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4051     {
4052       sv_rvweaken(obj);
4053     }
4054
4055     mg->mg_type = how;
4056     mg->mg_len = namlen;
4057     if (name) {
4058         if (namlen > 0)
4059             mg->mg_ptr = savepvn(name, namlen);
4060         else if (namlen == HEf_SVKEY)
4061             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4062         else
4063             mg->mg_ptr = (char *) name;
4064     }
4065     mg->mg_virtual = vtable;
4066
4067     mg_magical(sv);
4068     if (SvGMAGICAL(sv))
4069         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4070     return mg;
4071 }
4072
4073 /*
4074 =for apidoc sv_magic
4075
4076 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4077 then adds a new magic item of type C<how> to the head of the magic list.
4078
4079 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4080 handling of the C<name> and C<namlen> arguments.
4081
4082 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4083 to add more than one instance of the same 'how'.
4084
4085 =cut
4086 */
4087
4088 void
4089 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4090 {
4091     const MGVTBL *vtable;
4092     MAGIC* mg;
4093
4094 #ifdef PERL_OLD_COPY_ON_WRITE
4095     if (SvIsCOW(sv))
4096         sv_force_normal_flags(sv, 0);
4097 #endif
4098     if (SvREADONLY(sv)) {
4099         if (
4100             /* its okay to attach magic to shared strings; the subsequent
4101              * upgrade to PVMG will unshare the string */
4102             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4103
4104             && IN_PERL_RUNTIME
4105             && how != PERL_MAGIC_regex_global
4106             && how != PERL_MAGIC_bm
4107             && how != PERL_MAGIC_fm
4108             && how != PERL_MAGIC_sv
4109             && how != PERL_MAGIC_backref
4110            )
4111         {
4112             Perl_croak(aTHX_ PL_no_modify);
4113         }
4114     }
4115     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4116         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4117             /* sv_magic() refuses to add a magic of the same 'how' as an
4118                existing one
4119              */
4120             if (how == PERL_MAGIC_taint)
4121                 mg->mg_len |= 1;
4122             return;
4123         }
4124     }
4125
4126     switch (how) {
4127     case PERL_MAGIC_sv:
4128         vtable = &PL_vtbl_sv;
4129         break;
4130     case PERL_MAGIC_overload:
4131         vtable = &PL_vtbl_amagic;
4132         break;
4133     case PERL_MAGIC_overload_elem:
4134         vtable = &PL_vtbl_amagicelem;
4135         break;
4136     case PERL_MAGIC_overload_table:
4137         vtable = &PL_vtbl_ovrld;
4138         break;
4139     case PERL_MAGIC_bm:
4140         vtable = &PL_vtbl_bm;
4141         break;
4142     case PERL_MAGIC_regdata:
4143         vtable = &PL_vtbl_regdata;
4144         break;
4145     case PERL_MAGIC_regdatum:
4146         vtable = &PL_vtbl_regdatum;
4147         break;
4148     case PERL_MAGIC_env:
4149         vtable = &PL_vtbl_env;
4150         break;
4151     case PERL_MAGIC_fm:
4152         vtable = &PL_vtbl_fm;
4153         break;
4154     case PERL_MAGIC_envelem:
4155         vtable = &PL_vtbl_envelem;
4156         break;
4157     case PERL_MAGIC_regex_global:
4158         vtable = &PL_vtbl_mglob;
4159         break;
4160     case PERL_MAGIC_isa:
4161         vtable = &PL_vtbl_isa;
4162         break;
4163     case PERL_MAGIC_isaelem:
4164         vtable = &PL_vtbl_isaelem;
4165         break;
4166     case PERL_MAGIC_nkeys:
4167         vtable = &PL_vtbl_nkeys;
4168         break;
4169     case PERL_MAGIC_dbfile:
4170         vtable = NULL;
4171         break;
4172     case PERL_MAGIC_dbline:
4173         vtable = &PL_vtbl_dbline;
4174         break;
4175 #ifdef USE_LOCALE_COLLATE
4176     case PERL_MAGIC_collxfrm:
4177         vtable = &PL_vtbl_collxfrm;
4178         break;
4179 #endif /* USE_LOCALE_COLLATE */
4180     case PERL_MAGIC_tied:
4181         vtable = &PL_vtbl_pack;
4182         break;
4183     case PERL_MAGIC_tiedelem:
4184     case PERL_MAGIC_tiedscalar:
4185         vtable = &PL_vtbl_packelem;
4186         break;
4187     case PERL_MAGIC_qr:
4188         vtable = &PL_vtbl_regexp;
4189         break;
4190     case PERL_MAGIC_sig:
4191         vtable = &PL_vtbl_sig;
4192         break;
4193     case PERL_MAGIC_sigelem:
4194         vtable = &PL_vtbl_sigelem;
4195         break;
4196     case PERL_MAGIC_taint:
4197         vtable = &PL_vtbl_taint;
4198         break;
4199     case PERL_MAGIC_uvar:
4200         vtable = &PL_vtbl_uvar;
4201         break;
4202     case PERL_MAGIC_vec:
4203         vtable = &PL_vtbl_vec;
4204         break;
4205     case PERL_MAGIC_arylen_p:
4206     case PERL_MAGIC_rhash:
4207     case PERL_MAGIC_symtab:
4208     case PERL_MAGIC_vstring:
4209         vtable = NULL;
4210         break;
4211     case PERL_MAGIC_utf8:
4212         vtable = &PL_vtbl_utf8;
4213         break;
4214     case PERL_MAGIC_substr:
4215         vtable = &PL_vtbl_substr;
4216         break;
4217     case PERL_MAGIC_defelem:
4218         vtable = &PL_vtbl_defelem;
4219         break;
4220     case PERL_MAGIC_glob:
4221         vtable = &PL_vtbl_glob;
4222         break;
4223     case PERL_MAGIC_arylen:
4224         vtable = &PL_vtbl_arylen;
4225         break;
4226     case PERL_MAGIC_pos:
4227         vtable = &PL_vtbl_pos;
4228         break;
4229     case PERL_MAGIC_backref:
4230         vtable = &PL_vtbl_backref;
4231         break;
4232     case PERL_MAGIC_ext:
4233         /* Reserved for use by extensions not perl internals.           */
4234         /* Useful for attaching extension internal data to perl vars.   */
4235         /* Note that multiple extensions may clash if magical scalars   */
4236         /* etc holding private data from one are passed to another.     */
4237         vtable = NULL;
4238         break;
4239     default:
4240         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4241     }
4242
4243     /* Rest of work is done else where */
4244     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4245
4246     switch (how) {
4247     case PERL_MAGIC_taint:
4248         mg->mg_len = 1;
4249         break;
4250     case PERL_MAGIC_ext:
4251     case PERL_MAGIC_dbfile:
4252         SvRMAGICAL_on(sv);
4253         break;
4254     }
4255 }
4256
4257 /*
4258 =for apidoc sv_unmagic
4259
4260 Removes all magic of type C<type> from an SV.
4261
4262 =cut
4263 */
4264
4265 int
4266 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4267 {
4268     MAGIC* mg;
4269     MAGIC** mgp;
4270     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4271         return 0;
4272     mgp = &SvMAGIC(sv);
4273     for (mg = *mgp; mg; mg = *mgp) {
4274         if (mg->mg_type == type) {
4275             const MGVTBL* const vtbl = mg->mg_virtual;
4276             *mgp = mg->mg_moremagic;
4277             if (vtbl && vtbl->svt_free)
4278                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4279             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4280                 if (mg->mg_len > 0)
4281                     Safefree(mg->mg_ptr);
4282                 else if (mg->mg_len == HEf_SVKEY)
4283                     SvREFCNT_dec((SV*)mg->mg_ptr);
4284                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4285                     Safefree(mg->mg_ptr);
4286             }
4287             if (mg->mg_flags & MGf_REFCOUNTED)
4288                 SvREFCNT_dec(mg->mg_obj);
4289             Safefree(mg);
4290         }
4291         else
4292             mgp = &mg->mg_moremagic;
4293     }
4294     if (!SvMAGIC(sv)) {
4295         SvMAGICAL_off(sv);
4296        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4297     }
4298
4299     return 0;
4300 }
4301
4302 /*
4303 =for apidoc sv_rvweaken
4304
4305 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4306 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4307 push a back-reference to this RV onto the array of backreferences
4308 associated with that magic.
4309
4310 =cut
4311 */
4312
4313 SV *
4314 Perl_sv_rvweaken(pTHX_ SV *sv)
4315 {
4316     SV *tsv;
4317     if (!SvOK(sv))  /* let undefs pass */
4318         return sv;
4319     if (!SvROK(sv))
4320         Perl_croak(aTHX_ "Can't weaken a nonreference");
4321     else if (SvWEAKREF(sv)) {
4322         if (ckWARN(WARN_MISC))
4323             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4324         return sv;
4325     }
4326     tsv = SvRV(sv);
4327     Perl_sv_add_backref(aTHX_ tsv, sv);
4328     SvWEAKREF_on(sv);
4329     SvREFCNT_dec(tsv);
4330     return sv;
4331 }
4332
4333 /* Give tsv backref magic if it hasn't already got it, then push a
4334  * back-reference to sv onto the array associated with the backref magic.
4335  */
4336
4337 void
4338 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4339 {
4340     AV *av;
4341     MAGIC *mg;
4342     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4343         av = (AV*)mg->mg_obj;
4344     else {
4345         av = newAV();
4346         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4347         /* av now has a refcnt of 2, which avoids it getting freed
4348          * before us during global cleanup. The extra ref is removed
4349          * by magic_killbackrefs() when tsv is being freed */
4350     }
4351     if (AvFILLp(av) >= AvMAX(av)) {
4352         av_extend(av, AvFILLp(av)+1);
4353     }
4354     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4355 }
4356
4357 /* delete a back-reference to ourselves from the backref magic associated
4358  * with the SV we point to.
4359  */
4360
4361 STATIC void
4362 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4363 {
4364     AV *av;
4365     SV **svp;
4366     I32 i;
4367     MAGIC *mg = NULL;
4368     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4369         if (PL_in_clean_all)
4370             return;
4371     }
4372     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4373         Perl_croak(aTHX_ "panic: del_backref");
4374     av = (AV *)mg->mg_obj;
4375     svp = AvARRAY(av);
4376     /* We shouldn't be in here more than once, but for paranoia reasons lets
4377        not assume this.  */
4378     for (i = AvFILLp(av); i >= 0; i--) {
4379         if (svp[i] == sv) {
4380             const SSize_t fill = AvFILLp(av);
4381             if (i != fill) {
4382                 /* We weren't the last entry.
4383                    An unordered list has this property that you can take the
4384                    last element off the end to fill the hole, and it's still
4385                    an unordered list :-)
4386                 */
4387                 svp[i] = svp[fill];
4388             }
4389             svp[fill] = Nullsv;
4390             AvFILLp(av) = fill - 1;
4391         }
4392     }
4393 }
4394
4395 /*
4396 =for apidoc sv_insert
4397
4398 Inserts a string at the specified offset/length within the SV. Similar to
4399 the Perl substr() function.
4400
4401 =cut
4402 */
4403
4404 void
4405 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4406 {
4407     register char *big;
4408     register char *mid;
4409     register char *midend;
4410     register char *bigend;
4411     register I32 i;
4412     STRLEN curlen;
4413
4414
4415     if (!bigstr)
4416         Perl_croak(aTHX_ "Can't modify non-existent substring");
4417     SvPV_force(bigstr, curlen);
4418     (void)SvPOK_only_UTF8(bigstr);
4419     if (offset + len > curlen) {
4420         SvGROW(bigstr, offset+len+1);
4421         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4422         SvCUR_set(bigstr, offset+len);
4423     }
4424
4425     SvTAINT(bigstr);
4426     i = littlelen - len;
4427     if (i > 0) {                        /* string might grow */
4428         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4429         mid = big + offset + len;
4430         midend = bigend = big + SvCUR(bigstr);
4431         bigend += i;
4432         *bigend = '\0';
4433         while (midend > mid)            /* shove everything down */
4434             *--bigend = *--midend;
4435         Move(little,big+offset,littlelen,char);
4436         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4437         SvSETMAGIC(bigstr);
4438         return;
4439     }
4440     else if (i == 0) {
4441         Move(little,SvPVX(bigstr)+offset,len,char);
4442         SvSETMAGIC(bigstr);
4443         return;
4444     }
4445
4446     big = SvPVX(bigstr);
4447     mid = big + offset;
4448     midend = mid + len;
4449     bigend = big + SvCUR(bigstr);
4450
4451     if (midend > bigend)
4452         Perl_croak(aTHX_ "panic: sv_insert");
4453
4454     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4455         if (littlelen) {
4456             Move(little, mid, littlelen,char);
4457             mid += littlelen;
4458         }
4459         i = bigend - midend;
4460         if (i > 0) {
4461             Move(midend, mid, i,char);
4462             mid += i;
4463         }
4464         *mid = '\0';
4465         SvCUR_set(bigstr, mid - big);
4466     }
4467     else if ((i = mid - big)) { /* faster from front */
4468         midend -= littlelen;
4469         mid = midend;
4470         sv_chop(bigstr,midend-i);
4471         big += i;
4472         while (i--)
4473             *--midend = *--big;
4474         if (littlelen)
4475             Move(little, mid, littlelen,char);
4476     }
4477     else if (littlelen) {
4478         midend -= littlelen;
4479         sv_chop(bigstr,midend);
4480         Move(little,midend,littlelen,char);
4481     }
4482     else {
4483         sv_chop(bigstr,midend);
4484     }
4485     SvSETMAGIC(bigstr);
4486 }
4487
4488 /*
4489 =for apidoc sv_replace
4490
4491 Make the first argument a copy of the second, then delete the original.
4492 The target SV physically takes over ownership of the body of the source SV
4493 and inherits its flags; however, the target keeps any magic it owns,
4494 and any magic in the source is discarded.
4495 Note that this is a rather specialist SV copying operation; most of the
4496 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4497
4498 =cut
4499 */
4500
4501 void
4502 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4503 {
4504     const U32 refcnt = SvREFCNT(sv);
4505     SV_CHECK_THINKFIRST_COW_DROP(sv);
4506     if (SvREFCNT(nsv) != 1) {
4507         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4508                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4509     }
4510     if (SvMAGICAL(sv)) {
4511         if (SvMAGICAL(nsv))
4512             mg_free(nsv);
4513         else
4514             sv_upgrade(nsv, SVt_PVMG);
4515         SvMAGIC_set(nsv, SvMAGIC(sv));
4516         SvFLAGS(nsv) |= SvMAGICAL(sv);
4517         SvMAGICAL_off(sv);
4518         SvMAGIC_set(sv, NULL);
4519     }
4520     SvREFCNT(sv) = 0;
4521     sv_clear(sv);
4522     assert(!SvREFCNT(sv));
4523 #ifdef DEBUG_LEAKING_SCALARS
4524     sv->sv_flags  = nsv->sv_flags;
4525     sv->sv_any    = nsv->sv_any;
4526     sv->sv_refcnt = nsv->sv_refcnt;
4527     sv->sv_u      = nsv->sv_u;
4528 #else
4529     StructCopy(nsv,sv,SV);
4530 #endif
4531     /* Currently could join these into one piece of pointer arithmetic, but
4532        it would be unclear.  */
4533     if(SvTYPE(sv) == SVt_IV)
4534         SvANY(sv)
4535             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4536     else if (SvTYPE(sv) == SVt_RV) {
4537         SvANY(sv) = &sv->sv_u.svu_rv;
4538     }
4539         
4540
4541 #ifdef PERL_OLD_COPY_ON_WRITE
4542     if (SvIsCOW_normal(nsv)) {
4543         /* We need to follow the pointers around the loop to make the
4544            previous SV point to sv, rather than nsv.  */
4545         SV *next;
4546         SV *current = nsv;
4547         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4548             assert(next);
4549             current = next;
4550             assert(SvPVX_const(current) == SvPVX_const(nsv));
4551         }
4552         /* Make the SV before us point to the SV after us.  */
4553         if (DEBUG_C_TEST) {
4554             PerlIO_printf(Perl_debug_log, "previous is\n");
4555             sv_dump(current);
4556             PerlIO_printf(Perl_debug_log,
4557                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4558                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4559         }
4560         SV_COW_NEXT_SV_SET(current, sv);
4561     }
4562 #endif
4563     SvREFCNT(sv) = refcnt;
4564     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4565     SvREFCNT(nsv) = 0;
4566     del_SV(nsv);
4567 }
4568
4569 /*
4570 =for apidoc sv_clear
4571
4572 Clear an SV: call any destructors, free up any memory used by the body,
4573 and free the body itself. The SV's head is I<not> freed, although
4574 its type is set to all 1's so that it won't inadvertently be assumed
4575 to be live during global destruction etc.
4576 This function should only be called when REFCNT is zero. Most of the time
4577 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4578 instead.
4579
4580 =cut
4581 */
4582
4583 void
4584 Perl_sv_clear(pTHX_ register SV *sv)
4585 {
4586     dVAR;
4587     const U32 type = SvTYPE(sv);
4588     const struct body_details *const sv_type_details
4589         = bodies_by_type + type;
4590
4591     assert(sv);
4592     assert(SvREFCNT(sv) == 0);
4593
4594     if (type <= SVt_IV)
4595         return;
4596
4597     if (SvOBJECT(sv)) {
4598         if (PL_defstash) {              /* Still have a symbol table? */
4599             dSP;
4600             HV* stash;
4601             do {        
4602                 CV* destructor;
4603                 stash = SvSTASH(sv);
4604                 destructor = StashHANDLER(stash,DESTROY);
4605                 if (destructor) {
4606                     SV* const tmpref = newRV(sv);
4607                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4608                     ENTER;
4609                     PUSHSTACKi(PERLSI_DESTROY);
4610                     EXTEND(SP, 2);
4611                     PUSHMARK(SP);
4612                     PUSHs(tmpref);
4613                     PUTBACK;
4614                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4615                 
4616                 
4617                     POPSTACK;
4618                     SPAGAIN;
4619                     LEAVE;
4620                     if(SvREFCNT(tmpref) < 2) {
4621                         /* tmpref is not kept alive! */
4622                         SvREFCNT(sv)--;
4623                         SvRV_set(tmpref, NULL);
4624                         SvROK_off(tmpref);
4625                     }
4626                     SvREFCNT_dec(tmpref);
4627                 }
4628             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4629
4630
4631             if (SvREFCNT(sv)) {
4632                 if (PL_in_clean_objs)
4633                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4634                           HvNAME_get(stash));
4635                 /* DESTROY gave object new lease on life */
4636                 return;
4637             }
4638         }
4639
4640         if (SvOBJECT(sv)) {
4641             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4642             SvOBJECT_off(sv);   /* Curse the object. */
4643             if (type != SVt_PVIO)
4644                 --PL_sv_objcount;       /* XXX Might want something more general */
4645         }
4646     }
4647     if (type >= SVt_PVMG) {
4648         if (SvMAGIC(sv))
4649             mg_free(sv);
4650         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4651             SvREFCNT_dec(SvSTASH(sv));
4652     }
4653     switch (type) {
4654     case SVt_PVIO:
4655         if (IoIFP(sv) &&
4656             IoIFP(sv) != PerlIO_stdin() &&
4657             IoIFP(sv) != PerlIO_stdout() &&
4658             IoIFP(sv) != PerlIO_stderr())
4659         {
4660             io_close((IO*)sv, FALSE);
4661         }
4662         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4663             PerlDir_close(IoDIRP(sv));
4664         IoDIRP(sv) = (DIR*)NULL;
4665         Safefree(IoTOP_NAME(sv));
4666         Safefree(IoFMT_NAME(sv));
4667         Safefree(IoBOTTOM_NAME(sv));
4668         goto freescalar;
4669     case SVt_PVBM:
4670         goto freescalar;
4671     case SVt_PVCV:
4672     case SVt_PVFM:
4673         cv_undef((CV*)sv);
4674         goto freescalar;
4675     case SVt_PVHV:
4676         hv_undef((HV*)sv);
4677         break;
4678     case SVt_PVAV:
4679         av_undef((AV*)sv);
4680         break;
4681     case SVt_PVLV:
4682         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4683             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4684             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4685             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4686         }
4687         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4688             SvREFCNT_dec(LvTARG(sv));
4689         goto freescalar;
4690     case SVt_PVGV:
4691         gp_free((GV*)sv);
4692         Safefree(GvNAME(sv));
4693         /* If we're in a stash, we don't own a reference to it. However it does
4694            have a back reference to us, which needs to be cleared.  */
4695         if (GvSTASH(sv))
4696             sv_del_backref((SV*)GvSTASH(sv), sv);
4697     case SVt_PVMG:
4698     case SVt_PVNV:
4699     case SVt_PVIV:
4700       freescalar:
4701         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4702         if (SvOOK(sv)) {
4703             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4704             /* Don't even bother with turning off the OOK flag.  */
4705         }
4706     case SVt_PV:
4707     case SVt_RV:
4708         if (SvROK(sv)) {
4709             SV *target = SvRV(sv);
4710             if (SvWEAKREF(sv))
4711                 sv_del_backref(target, sv);
4712             else
4713                 SvREFCNT_dec(target);
4714         }
4715 #ifdef PERL_OLD_COPY_ON_WRITE
4716         else if (SvPVX_const(sv)) {
4717             if (SvIsCOW(sv)) {
4718                 /* I believe I need to grab the global SV mutex here and
4719                    then recheck the COW status.  */
4720                 if (DEBUG_C_TEST) {
4721                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4722                     sv_dump(sv);
4723                 }
4724                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4725                                SV_COW_NEXT_SV(sv));
4726                 /* And drop it here.  */
4727                 SvFAKE_off(sv);
4728             } else if (SvLEN(sv)) {
4729                 Safefree(SvPVX_const(sv));
4730             }
4731         }
4732 #else
4733         else if (SvPVX_const(sv) && SvLEN(sv))
4734             Safefree(SvPVX_mutable(sv));
4735         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4736             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4737             SvFAKE_off(sv);
4738         }
4739 #endif
4740         break;
4741     case SVt_NV:
4742         break;
4743     }
4744
4745     SvFLAGS(sv) &= SVf_BREAK;
4746     SvFLAGS(sv) |= SVTYPEMASK;
4747
4748     if (sv_type_details->arena) {
4749         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4750                  &PL_body_roots[type]);
4751     }
4752     else if (sv_type_details->size) {
4753         my_safefree(SvANY(sv));
4754     }
4755 }
4756
4757 /*
4758 =for apidoc sv_newref
4759
4760 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
4761 instead.
4762
4763 =cut
4764 */
4765
4766 SV *
4767 Perl_sv_newref(pTHX_ SV *sv)
4768 {
4769     if (sv)
4770         (SvREFCNT(sv))++;
4771     return sv;
4772 }
4773
4774 /*
4775 =for apidoc sv_free
4776
4777 Decrement an SV's reference count, and if it drops to zero, call
4778 C<sv_clear> to invoke destructors and free up any memory used by
4779 the body; finally, deallocate the SV's head itself.
4780 Normally called via a wrapper macro C<SvREFCNT_dec>.
4781
4782 =cut
4783 */
4784
4785 void
4786 Perl_sv_free(pTHX_ SV *sv)
4787 {
4788     dVAR;
4789     if (!sv)
4790         return;
4791     if (SvREFCNT(sv) == 0) {
4792         if (SvFLAGS(sv) & SVf_BREAK)
4793             /* this SV's refcnt has been artificially decremented to
4794              * trigger cleanup */
4795             return;
4796         if (PL_in_clean_all) /* All is fair */
4797             return;
4798         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4799             /* make sure SvREFCNT(sv)==0 happens very seldom */
4800             SvREFCNT(sv) = (~(U32)0)/2;
4801             return;
4802         }
4803         if (ckWARN_d(WARN_INTERNAL)) {
4804             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
4805                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
4806                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4807 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
4808             Perl_dump_sv_child(aTHX_ sv);
4809 #endif
4810         }
4811         return;
4812     }
4813     if (--(SvREFCNT(sv)) > 0)
4814         return;
4815     Perl_sv_free2(aTHX_ sv);
4816 }
4817
4818 void
4819 Perl_sv_free2(pTHX_ SV *sv)
4820 {
4821     dVAR;
4822 #ifdef DEBUGGING
4823     if (SvTEMP(sv)) {
4824         if (ckWARN_d(WARN_DEBUGGING))
4825             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
4826                         "Attempt to free temp prematurely: SV 0x%"UVxf
4827                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4828         return;
4829     }
4830 #endif
4831     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4832         /* make sure SvREFCNT(sv)==0 happens very seldom */
4833         SvREFCNT(sv) = (~(U32)0)/2;
4834         return;
4835     }
4836     sv_clear(sv);
4837     if (! SvREFCNT(sv))
4838         del_SV(sv);
4839 }
4840
4841 /*
4842 =for apidoc sv_len
4843
4844 Returns the length of the string in the SV. Handles magic and type
4845 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
4846
4847 =cut
4848 */
4849
4850 STRLEN
4851 Perl_sv_len(pTHX_ register SV *sv)
4852 {
4853     STRLEN len;
4854
4855     if (!sv)
4856         return 0;
4857
4858     if (SvGMAGICAL(sv))
4859         len = mg_length(sv);
4860     else
4861         (void)SvPV_const(sv, len);
4862     return len;
4863 }
4864
4865 /*
4866 =for apidoc sv_len_utf8
4867
4868 Returns the number of characters in the string in an SV, counting wide
4869 UTF-8 bytes as a single character. Handles magic and type coercion.
4870
4871 =cut
4872 */
4873
4874 /*
4875  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
4876  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
4877  * (Note that the mg_len is not the length of the mg_ptr field.)
4878  *
4879  */
4880
4881 STRLEN
4882 Perl_sv_len_utf8(pTHX_ register SV *sv)
4883 {
4884     if (!sv)
4885         return 0;
4886
4887     if (SvGMAGICAL(sv))
4888         return mg_length(sv);
4889     else
4890     {
4891         STRLEN len, ulen;
4892         const U8 *s = (U8*)SvPV_const(sv, len);
4893         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
4894
4895         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
4896             ulen = mg->mg_len;
4897 #ifdef PERL_UTF8_CACHE_ASSERT
4898             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
4899 #endif
4900         }
4901         else {
4902             ulen = Perl_utf8_length(aTHX_ s, s + len);
4903             if (!mg && !SvREADONLY(sv)) {
4904                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
4905                 mg = mg_find(sv, PERL_MAGIC_utf8);
4906                 assert(mg);
4907             }
4908             if (mg)
4909                 mg->mg_len = ulen;
4910         }
4911         return ulen;
4912     }
4913 }
4914
4915 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
4916  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4917  * between UTF-8 and byte offsets.  There are two (substr offset and substr
4918  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
4919  * and byte offset) cache positions.
4920  *
4921  * The mg_len field is used by sv_len_utf8(), see its comments.
4922  * Note that the mg_len is not the length of the mg_ptr field.
4923  *
4924  */
4925 STATIC bool
4926 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
4927                    I32 offsetp, const U8 *s, const U8 *start)
4928 {
4929     bool found = FALSE;
4930
4931     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4932         if (!*mgp)
4933             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
4934         assert(*mgp);
4935
4936         if ((*mgp)->mg_ptr)
4937             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4938         else {
4939             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
4940             (*mgp)->mg_ptr = (char *) *cachep;
4941         }
4942         assert(*cachep);
4943
4944         (*cachep)[i]   = offsetp;
4945         (*cachep)[i+1] = s - start;
4946         found = TRUE;
4947     }
4948
4949     return found;
4950 }
4951
4952 /*
4953  * S_utf8_mg_pos() is used to query and update mg_ptr field of
4954  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4955  * between UTF-8 and byte offsets.  See also the comments of
4956  * S_utf8_mg_pos_init().
4957  *
4958  */
4959 STATIC bool
4960 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
4961 {
4962     bool found = FALSE;
4963
4964     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4965         if (!*mgp)
4966             *mgp = mg_find(sv, PERL_MAGIC_utf8);
4967         if (*mgp && (*mgp)->mg_ptr) {
4968             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4969             ASSERT_UTF8_CACHE(*cachep);
4970             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
4971                  found = TRUE;
4972             else {                      /* We will skip to the right spot. */
4973                  STRLEN forw  = 0;
4974                  STRLEN backw = 0;
4975                  const U8* p = NULL;
4976
4977                  /* The assumption is that going backward is half
4978                   * the speed of going forward (that's where the
4979                   * 2 * backw in the below comes from).  (The real
4980                   * figure of course depends on the UTF-8 data.) */
4981
4982                  if ((*cachep)[i] > (STRLEN)uoff) {
4983                       forw  = uoff;
4984                       backw = (*cachep)[i] - (STRLEN)uoff;
4985
4986                       if (forw < 2 * backw)
4987                            p = start;
4988                       else
4989                            p = start + (*cachep)[i+1];
4990                  }
4991                  /* Try this only for the substr offset (i == 0),
4992                   * not for the substr length (i == 2). */
4993                  else if (i == 0) { /* (*cachep)[i] < uoff */
4994                       const STRLEN ulen = sv_len_utf8(sv);
4995
4996                       if ((STRLEN)uoff < ulen) {
4997                            forw  = (STRLEN)uoff - (*cachep)[i];
4998                            backw = ulen - (STRLEN)uoff;
4999
5000                            if (forw < 2 * backw)
5001                                 p = start + (*cachep)[i+1];
5002                            else
5003                                 p = send;
5004                       }
5005
5006                       /* If the string is not long enough for uoff,
5007                        * we could extend it, but not at this low a level. */
5008                  }
5009
5010                  if (p) {
5011                       if (forw < 2 * backw) {
5012                            while (forw--)
5013                                 p += UTF8SKIP(p);
5014                       }
5015                       else {
5016                            while (backw--) {
5017                                 p--;
5018                                 while (UTF8_IS_CONTINUATION(*p))
5019                                      p--;
5020                            }
5021                       }
5022
5023                       /* Update the cache. */
5024                       (*cachep)[i]   = (STRLEN)uoff;
5025                       (*cachep)[i+1] = p - start;
5026
5027                       /* Drop the stale "length" cache */
5028                       if (i == 0) {
5029                           (*cachep)[2] = 0;
5030                           (*cachep)[3] = 0;
5031                       }
5032
5033                       found = TRUE;
5034                  }
5035             }
5036             if (found) {        /* Setup the return values. */
5037                  *offsetp = (*cachep)[i+1];
5038                  *sp = start + *offsetp;
5039                  if (*sp >= send) {
5040                       *sp = send;
5041                       *offsetp = send - start;
5042                  }
5043                  else if (*sp < start) {
5044                       *sp = start;
5045                       *offsetp = 0;
5046                  }
5047             }
5048         }
5049 #ifdef PERL_UTF8_CACHE_ASSERT
5050         if (found) {
5051              U8 *s = start;
5052              I32 n = uoff;
5053
5054              while (n-- && s < send)
5055                   s += UTF8SKIP(s);
5056
5057              if (i == 0) {
5058                   assert(*offsetp == s - start);
5059                   assert((*cachep)[0] == (STRLEN)uoff);
5060                   assert((*cachep)[1] == *offsetp);
5061              }
5062              ASSERT_UTF8_CACHE(*cachep);
5063         }
5064 #endif
5065     }
5066
5067     return found;
5068 }
5069
5070 /*
5071 =for apidoc sv_pos_u2b
5072
5073 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5074 the start of the string, to a count of the equivalent number of bytes; if
5075 lenp is non-zero, it does the same to lenp, but this time starting from
5076 the offset, rather than from the start of the string. Handles magic and
5077 type coercion.
5078
5079 =cut
5080 */
5081
5082 /*
5083  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5084  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5085  * byte offsets.  See also the comments of S_utf8_mg_pos().
5086  *
5087  */
5088
5089 void
5090 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5091 {
5092     const U8 *start;
5093     STRLEN len;
5094
5095     if (!sv)
5096         return;
5097
5098     start = (U8*)SvPV_const(sv, len);
5099     if (len) {
5100         STRLEN boffset = 0;
5101         STRLEN *cache = 0;
5102         const U8 *s = start;
5103         I32 uoffset = *offsetp;
5104         const U8 * const send = s + len;
5105         MAGIC *mg = 0;
5106         bool found = FALSE;
5107
5108          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5109              found = TRUE;
5110          if (!found && uoffset > 0) {
5111               while (s < send && uoffset--)
5112                    s += UTF8SKIP(s);
5113               if (s >= send)
5114                    s = send;
5115               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5116                   boffset = cache[1];
5117               *offsetp = s - start;
5118          }
5119          if (lenp) {
5120               found = FALSE;
5121               start = s;
5122               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5123                   *lenp -= boffset;
5124                   found = TRUE;
5125               }
5126               if (!found && *lenp > 0) {
5127                    I32 ulen = *lenp;
5128                    if (ulen > 0)
5129                         while (s < send && ulen--)
5130                              s += UTF8SKIP(s);
5131                    if (s >= send)
5132                         s = send;
5133                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5134               }
5135               *lenp = s - start;
5136          }
5137          ASSERT_UTF8_CACHE(cache);
5138     }
5139     else {
5140          *offsetp = 0;
5141          if (lenp)
5142               *lenp = 0;
5143     }
5144
5145     return;
5146 }
5147
5148 /*
5149 =for apidoc sv_pos_b2u
5150
5151 Converts the value pointed to by offsetp from a count of bytes from the
5152 start of the string, to a count of the equivalent number of UTF-8 chars.
5153 Handles magic and type coercion.
5154
5155 =cut
5156 */
5157
5158 /*
5159  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5160  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5161  * byte offsets.  See also the comments of S_utf8_mg_pos().
5162  *
5163  */
5164
5165 void
5166 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5167 {
5168     const U8* s;
5169     STRLEN len;
5170
5171     if (!sv)
5172         return;
5173
5174     s = (const U8*)SvPV_const(sv, len);
5175     if ((I32)len < *offsetp)
5176         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5177     else {
5178         const U8* send = s + *offsetp;
5179         MAGIC* mg = NULL;
5180         STRLEN *cache = NULL;
5181
5182         len = 0;
5183
5184         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5185             mg = mg_find(sv, PERL_MAGIC_utf8);
5186             if (mg && mg->mg_ptr) {
5187                 cache = (STRLEN *) mg->mg_ptr;
5188                 if (cache[1] == (STRLEN)*offsetp) {
5189                     /* An exact match. */
5190                     *offsetp = cache[0];
5191
5192                     return;
5193                 }
5194                 else if (cache[1] < (STRLEN)*offsetp) {
5195                     /* We already know part of the way. */
5196                     len = cache[0];
5197                     s  += cache[1];
5198                     /* Let the below loop do the rest. */
5199                 }
5200                 else { /* cache[1] > *offsetp */
5201                     /* We already know all of the way, now we may
5202                      * be able to walk back.  The same assumption
5203                      * is made as in S_utf8_mg_pos(), namely that
5204                      * walking backward is twice slower than
5205                      * walking forward. */
5206                     const STRLEN forw  = *offsetp;
5207                     STRLEN backw = cache[1] - *offsetp;
5208
5209                     if (!(forw < 2 * backw)) {
5210                         const U8 *p = s + cache[1];
5211                         STRLEN ubackw = 0;
5212                         
5213                         cache[1] -= backw;
5214
5215                         while (backw--) {
5216                             p--;
5217                             while (UTF8_IS_CONTINUATION(*p)) {
5218                                 p--;
5219                                 backw--;
5220                             }
5221                             ubackw++;
5222                         }
5223
5224                         cache[0] -= ubackw;
5225                         *offsetp = cache[0];
5226
5227                         /* Drop the stale "length" cache */
5228                         cache[2] = 0;
5229                         cache[3] = 0;
5230
5231                         return;
5232                     }
5233                 }
5234             }
5235             ASSERT_UTF8_CACHE(cache);
5236         }
5237
5238         while (s < send) {
5239             STRLEN n = 1;
5240
5241             /* Call utf8n_to_uvchr() to validate the sequence
5242              * (unless a simple non-UTF character) */
5243             if (!UTF8_IS_INVARIANT(*s))
5244                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5245             if (n > 0) {
5246                 s += n;
5247                 len++;
5248             }
5249             else
5250                 break;
5251         }
5252
5253         if (!SvREADONLY(sv)) {
5254             if (!mg) {
5255                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5256                 mg = mg_find(sv, PERL_MAGIC_utf8);
5257             }
5258             assert(mg);
5259
5260             if (!mg->mg_ptr) {
5261                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5262                 mg->mg_ptr = (char *) cache;
5263             }
5264             assert(cache);
5265
5266             cache[0] = len;
5267             cache[1] = *offsetp;
5268             /* Drop the stale "length" cache */
5269             cache[2] = 0;
5270             cache[3] = 0;
5271         }
5272
5273         *offsetp = len;
5274     }
5275     return;
5276 }
5277
5278 /*
5279 =for apidoc sv_eq
5280
5281 Returns a boolean indicating whether the strings in the two SVs are
5282 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5283 coerce its args to strings if necessary.
5284
5285 =cut
5286 */
5287
5288 I32
5289 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5290 {
5291     const char *pv1;
5292     STRLEN cur1;
5293     const char *pv2;
5294     STRLEN cur2;
5295     I32  eq     = 0;
5296     char *tpv   = Nullch;
5297     SV* svrecode = Nullsv;
5298
5299     if (!sv1) {
5300         pv1 = "";
5301         cur1 = 0;
5302     }
5303     else
5304         pv1 = SvPV_const(sv1, cur1);
5305
5306     if (!sv2){
5307         pv2 = "";
5308         cur2 = 0;
5309     }
5310     else
5311         pv2 = SvPV_const(sv2, cur2);
5312
5313     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5314         /* Differing utf8ness.
5315          * Do not UTF8size the comparands as a side-effect. */
5316          if (PL_encoding) {
5317               if (SvUTF8(sv1)) {
5318                    svrecode = newSVpvn(pv2, cur2);
5319                    sv_recode_to_utf8(svrecode, PL_encoding);
5320                    pv2 = SvPV_const(svrecode, cur2);
5321               }
5322               else {
5323                    svrecode = newSVpvn(pv1, cur1);
5324                    sv_recode_to_utf8(svrecode, PL_encoding);
5325                    pv1 = SvPV_const(svrecode, cur1);
5326               }
5327               /* Now both are in UTF-8. */
5328               if (cur1 != cur2) {
5329                    SvREFCNT_dec(svrecode);
5330                    return FALSE;
5331               }
5332          }
5333          else {
5334               bool is_utf8 = TRUE;
5335
5336               if (SvUTF8(sv1)) {
5337                    /* sv1 is the UTF-8 one,
5338                     * if is equal it must be downgrade-able */
5339                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5340                                                      &cur1, &is_utf8);
5341                    if (pv != pv1)
5342                         pv1 = tpv = pv;
5343               }
5344               else {
5345                    /* sv2 is the UTF-8 one,
5346                     * if is equal it must be downgrade-able */
5347                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5348                                                       &cur2, &is_utf8);
5349                    if (pv != pv2)
5350                         pv2 = tpv = pv;
5351               }
5352               if (is_utf8) {
5353                    /* Downgrade not possible - cannot be eq */
5354                    assert (tpv == 0);
5355                    return FALSE;
5356               }
5357          }
5358     }
5359
5360     if (cur1 == cur2)
5361         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5362         
5363     if (svrecode)
5364          SvREFCNT_dec(svrecode);
5365
5366     if (tpv)
5367         Safefree(tpv);
5368
5369     return eq;
5370 }
5371
5372 /*
5373 =for apidoc sv_cmp
5374
5375 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5376 string in C<sv1> is less than, equal to, or greater than the string in
5377 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5378 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5379
5380 =cut
5381 */
5382
5383 I32
5384 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5385 {
5386     STRLEN cur1, cur2;
5387     const char *pv1, *pv2;
5388     char *tpv = Nullch;
5389     I32  cmp;
5390     SV *svrecode = Nullsv;
5391
5392     if (!sv1) {
5393         pv1 = "";
5394         cur1 = 0;
5395     }
5396     else
5397         pv1 = SvPV_const(sv1, cur1);
5398
5399     if (!sv2) {
5400         pv2 = "";
5401         cur2 = 0;
5402     }
5403     else
5404         pv2 = SvPV_const(sv2, cur2);
5405
5406     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5407         /* Differing utf8ness.
5408          * Do not UTF8size the comparands as a side-effect. */
5409         if (SvUTF8(sv1)) {
5410             if (PL_encoding) {
5411                  svrecode = newSVpvn(pv2, cur2);
5412                  sv_recode_to_utf8(svrecode, PL_encoding);
5413                  pv2 = SvPV_const(svrecode, cur2);
5414             }
5415             else {
5416                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5417             }
5418         }
5419         else {
5420             if (PL_encoding) {
5421                  svrecode = newSVpvn(pv1, cur1);
5422                  sv_recode_to_utf8(svrecode, PL_encoding);
5423                  pv1 = SvPV_const(svrecode, cur1);
5424             }
5425             else {
5426                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5427             }
5428         }
5429     }
5430
5431     if (!cur1) {
5432         cmp = cur2 ? -1 : 0;
5433     } else if (!cur2) {
5434         cmp = 1;
5435     } else {
5436         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5437
5438         if (retval) {
5439             cmp = retval < 0 ? -1 : 1;
5440         } else if (cur1 == cur2) {
5441             cmp = 0;
5442         } else {
5443             cmp = cur1 < cur2 ? -1 : 1;
5444         }
5445     }
5446
5447     if (svrecode)
5448          SvREFCNT_dec(svrecode);
5449
5450     if (tpv)
5451         Safefree(tpv);
5452
5453     return cmp;
5454 }
5455
5456 /*
5457 =for apidoc sv_cmp_locale
5458
5459 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5460 'use bytes' aware, handles get magic, and will coerce its args to strings
5461 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5462
5463 =cut
5464 */
5465
5466 I32
5467 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5468 {
5469 #ifdef USE_LOCALE_COLLATE
5470
5471     char *pv1, *pv2;
5472     STRLEN len1, len2;
5473     I32 retval;
5474
5475     if (PL_collation_standard)
5476         goto raw_compare;
5477
5478     len1 = 0;
5479     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5480     len2 = 0;
5481     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5482
5483     if (!pv1 || !len1) {
5484         if (pv2 && len2)
5485             return -1;
5486         else
5487             goto raw_compare;
5488     }
5489     else {
5490         if (!pv2 || !len2)
5491             return 1;
5492     }
5493
5494     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5495
5496     if (retval)
5497         return retval < 0 ? -1 : 1;
5498
5499     /*
5500      * When the result of collation is equality, that doesn't mean
5501      * that there are no differences -- some locales exclude some
5502      * characters from consideration.  So to avoid false equalities,
5503      * we use the raw string as a tiebreaker.
5504      */
5505
5506   raw_compare:
5507     /* FALL THROUGH */
5508
5509 #endif /* USE_LOCALE_COLLATE */
5510
5511     return sv_cmp(sv1, sv2);
5512 }
5513
5514
5515 #ifdef USE_LOCALE_COLLATE
5516
5517 /*
5518 =for apidoc sv_collxfrm
5519
5520 Add Collate Transform magic to an SV if it doesn't already have it.
5521
5522 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5523 scalar data of the variable, but transformed to such a format that a normal
5524 memory comparison can be used to compare the data according to the locale
5525 settings.
5526
5527 =cut
5528 */
5529
5530 char *
5531 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5532 {
5533     MAGIC *mg;
5534
5535     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5536     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5537         const char *s;
5538         char *xf;
5539         STRLEN len, xlen;
5540
5541         if (mg)
5542             Safefree(mg->mg_ptr);
5543         s = SvPV_const(sv, len);
5544         if ((xf = mem_collxfrm(s, len, &xlen))) {
5545             if (SvREADONLY(sv)) {
5546                 SAVEFREEPV(xf);
5547                 *nxp = xlen;
5548                 return xf + sizeof(PL_collation_ix);
5549             }
5550             if (! mg) {
5551                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5552                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5553                 assert(mg);
5554             }
5555             mg->mg_ptr = xf;
5556             mg->mg_len = xlen;
5557         }
5558         else {
5559             if (mg) {
5560                 mg->mg_ptr = NULL;
5561                 mg->mg_len = -1;
5562             }
5563         }
5564     }
5565     if (mg && mg->mg_ptr) {
5566         *nxp = mg->mg_len;
5567         return mg->mg_ptr + sizeof(PL_collation_ix);
5568     }
5569     else {
5570         *nxp = 0;
5571         return NULL;
5572     }
5573 }
5574
5575 #endif /* USE_LOCALE_COLLATE */
5576
5577 /*
5578 =for apidoc sv_gets
5579
5580 Get a line from the filehandle and store it into the SV, optionally
5581 appending to the currently-stored string.
5582
5583 =cut
5584 */
5585
5586 char *
5587 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5588 {
5589     const char *rsptr;
5590     STRLEN rslen;
5591     register STDCHAR rslast;
5592     register STDCHAR *bp;
5593     register I32 cnt;
5594     I32 i = 0;
5595     I32 rspara = 0;
5596     I32 recsize;
5597
5598     if (SvTHINKFIRST(sv))
5599         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5600     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5601        from <>.
5602        However, perlbench says it's slower, because the existing swipe code
5603        is faster than copy on write.
5604        Swings and roundabouts.  */
5605     SvUPGRADE(sv, SVt_PV);
5606
5607     SvSCREAM_off(sv);
5608
5609     if (append) {
5610         if (PerlIO_isutf8(fp)) {
5611             if (!SvUTF8(sv)) {
5612                 sv_utf8_upgrade_nomg(sv);
5613                 sv_pos_u2b(sv,&append,0);
5614             }
5615         } else if (SvUTF8(sv)) {
5616             SV * const tsv = NEWSV(0,0);
5617             sv_gets(tsv, fp, 0);
5618             sv_utf8_upgrade_nomg(tsv);
5619             SvCUR_set(sv,append);
5620             sv_catsv(sv,tsv);
5621             sv_free(tsv);
5622             goto return_string_or_null;
5623         }
5624     }
5625
5626     SvPOK_only(sv);
5627     if (PerlIO_isutf8(fp))
5628         SvUTF8_on(sv);
5629
5630     if (IN_PERL_COMPILETIME) {
5631         /* we always read code in line mode */
5632         rsptr = "\n";
5633         rslen = 1;
5634     }
5635     else if (RsSNARF(PL_rs)) {
5636         /* If it is a regular disk file use size from stat() as estimate
5637            of amount we are going to read - may result in malloc-ing
5638            more memory than we realy need if layers bellow reduce
5639            size we read (e.g. CRLF or a gzip layer)
5640          */
5641         Stat_t st;
5642         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5643             const Off_t offset = PerlIO_tell(fp);
5644             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5645                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5646             }
5647         }
5648         rsptr = NULL;
5649         rslen = 0;
5650     }
5651     else if (RsRECORD(PL_rs)) {
5652       I32 bytesread;
5653       char *buffer;
5654
5655       /* Grab the size of the record we're getting */
5656       recsize = SvIV(SvRV(PL_rs));
5657       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5658       /* Go yank in */
5659 #ifdef VMS
5660       /* VMS wants read instead of fread, because fread doesn't respect */
5661       /* RMS record boundaries. This is not necessarily a good thing to be */
5662       /* doing, but we've got no other real choice - except avoid stdio
5663          as implementation - perhaps write a :vms layer ?
5664        */
5665       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5666 #else
5667       bytesread = PerlIO_read(fp, buffer, recsize);
5668 #endif
5669       if (bytesread < 0)
5670           bytesread = 0;
5671       SvCUR_set(sv, bytesread += append);
5672       buffer[bytesread] = '\0';
5673       goto return_string_or_null;
5674     }
5675     else if (RsPARA(PL_rs)) {
5676         rsptr = "\n\n";
5677         rslen = 2;
5678         rspara = 1;
5679     }
5680     else {
5681         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5682         if (PerlIO_isutf8(fp)) {
5683             rsptr = SvPVutf8(PL_rs, rslen);
5684         }
5685         else {
5686             if (SvUTF8(PL_rs)) {
5687                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5688                     Perl_croak(aTHX_ "Wide character in $/");
5689                 }
5690             }
5691             rsptr = SvPV_const(PL_rs, rslen);
5692         }
5693     }
5694
5695     rslast = rslen ? rsptr[rslen - 1] : '\0';
5696
5697     if (rspara) {               /* have to do this both before and after */
5698         do {                    /* to make sure file boundaries work right */
5699             if (PerlIO_eof(fp))
5700                 return 0;
5701             i = PerlIO_getc(fp);
5702             if (i != '\n') {
5703                 if (i == -1)
5704                     return 0;
5705                 PerlIO_ungetc(fp,i);
5706                 break;
5707             }
5708         } while (i != EOF);
5709     }
5710
5711     /* See if we know enough about I/O mechanism to cheat it ! */
5712
5713     /* This used to be #ifdef test - it is made run-time test for ease
5714        of abstracting out stdio interface. One call should be cheap
5715        enough here - and may even be a macro allowing compile
5716        time optimization.
5717      */
5718
5719     if (PerlIO_fast_gets(fp)) {
5720
5721     /*
5722      * We're going to steal some values from the stdio struct
5723      * and put EVERYTHING in the innermost loop into registers.
5724      */
5725     register STDCHAR *ptr;
5726     STRLEN bpx;
5727     I32 shortbuffered;
5728
5729 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5730     /* An ungetc()d char is handled separately from the regular
5731      * buffer, so we getc() it back out and stuff it in the buffer.
5732      */
5733     i = PerlIO_getc(fp);
5734     if (i == EOF) return 0;
5735     *(--((*fp)->_ptr)) = (unsigned char) i;
5736     (*fp)->_cnt++;
5737 #endif
5738
5739     /* Here is some breathtakingly efficient cheating */
5740
5741     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5742     /* make sure we have the room */
5743     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5744         /* Not room for all of it
5745            if we are looking for a separator and room for some
5746          */
5747         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5748             /* just process what we have room for */
5749             shortbuffered = cnt - SvLEN(sv) + append + 1;
5750             cnt -= shortbuffered;
5751         }
5752         else {
5753             shortbuffered = 0;
5754             /* remember that cnt can be negative */
5755             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5756         }
5757     }
5758     else
5759         shortbuffered = 0;
5760     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
5761     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
5762     DEBUG_P(PerlIO_printf(Perl_debug_log,
5763         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5764     DEBUG_P(PerlIO_printf(Perl_debug_log,
5765         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5766                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5767                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
5768     for (;;) {
5769       screamer:
5770         if (cnt > 0) {
5771             if (rslen) {
5772                 while (cnt > 0) {                    /* this     |  eat */
5773                     cnt--;
5774                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
5775                         goto thats_all_folks;        /* screams  |  sed :-) */
5776                 }
5777             }
5778             else {
5779                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
5780                 bp += cnt;                           /* screams  |  dust */
5781                 ptr += cnt;                          /* louder   |  sed :-) */
5782                 cnt = 0;
5783             }
5784         }
5785         
5786         if (shortbuffered) {            /* oh well, must extend */
5787             cnt = shortbuffered;
5788             shortbuffered = 0;
5789             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
5790             SvCUR_set(sv, bpx);
5791             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
5792             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
5793             continue;
5794         }
5795
5796         DEBUG_P(PerlIO_printf(Perl_debug_log,
5797                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
5798                               PTR2UV(ptr),(long)cnt));
5799         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
5800 #if 0
5801         DEBUG_P(PerlIO_printf(Perl_debug_log,
5802             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5803             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5804             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5805 #endif
5806         /* This used to call 'filbuf' in stdio form, but as that behaves like
5807            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
5808            another abstraction.  */
5809         i   = PerlIO_getc(fp);          /* get more characters */
5810 #if 0
5811         DEBUG_P(PerlIO_printf(Perl_debug_log,
5812             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5813             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5814             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5815 #endif
5816         cnt = PerlIO_get_cnt(fp);
5817         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
5818         DEBUG_P(PerlIO_printf(Perl_debug_log,
5819             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5820
5821         if (i == EOF)                   /* all done for ever? */
5822             goto thats_really_all_folks;
5823
5824         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
5825         SvCUR_set(sv, bpx);
5826         SvGROW(sv, bpx + cnt + 2);
5827         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
5828
5829         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
5830
5831         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
5832             goto thats_all_folks;
5833     }
5834
5835 thats_all_folks:
5836     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
5837           memNE((char*)bp - rslen, rsptr, rslen))
5838         goto screamer;                          /* go back to the fray */
5839 thats_really_all_folks:
5840     if (shortbuffered)
5841         cnt += shortbuffered;
5842         DEBUG_P(PerlIO_printf(Perl_debug_log,
5843             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5844     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
5845     DEBUG_P(PerlIO_printf(Perl_debug_log,
5846         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5847         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5848         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5849     *bp = '\0';
5850     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
5851     DEBUG_P(PerlIO_printf(Perl_debug_log,
5852         "Screamer: done, len=%ld, string=|%.*s|\n",
5853         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
5854     }
5855    else
5856     {
5857        /*The big, slow, and stupid way. */
5858 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
5859         STDCHAR *buf = 0;
5860         Newx(buf, 8192, STDCHAR);
5861         assert(buf);
5862 #else
5863         STDCHAR buf[8192];
5864 #endif
5865
5866 screamer2:
5867         if (rslen) {
5868             register const STDCHAR * const bpe = buf + sizeof(buf);
5869             bp = buf;
5870             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
5871                 ; /* keep reading */
5872             cnt = bp - buf;
5873         }
5874         else {
5875             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
5876             /* Accomodate broken VAXC compiler, which applies U8 cast to
5877              * both args of ?: operator, causing EOF to change into 255
5878              */
5879             if (cnt > 0)
5880                  i = (U8)buf[cnt - 1];
5881             else
5882                  i = EOF;
5883         }
5884
5885         if (cnt < 0)
5886             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
5887         if (append)
5888              sv_catpvn(sv, (char *) buf, cnt);
5889         else
5890              sv_setpvn(sv, (char *) buf, cnt);
5891
5892         if (i != EOF &&                 /* joy */
5893             (!rslen ||
5894              SvCUR(sv) < rslen ||
5895              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
5896         {
5897             append = -1;
5898             /*
5899              * If we're reading from a TTY and we get a short read,
5900              * indicating that the user hit his EOF character, we need
5901              * to notice it now, because if we try to read from the TTY
5902              * again, the EOF condition will disappear.
5903              *
5904              * The comparison of cnt to sizeof(buf) is an optimization
5905              * that prevents unnecessary calls to feof().
5906              *
5907              * - jik 9/25/96
5908              */
5909             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
5910                 goto screamer2;
5911         }
5912
5913 #ifdef USE_HEAP_INSTEAD_OF_STACK
5914         Safefree(buf);
5915 #endif
5916     }
5917
5918     if (rspara) {               /* have to do this both before and after */
5919         while (i != EOF) {      /* to make sure file boundaries work right */
5920             i = PerlIO_getc(fp);
5921             if (i != '\n') {
5922                 PerlIO_ungetc(fp,i);
5923                 break;
5924             }
5925         }
5926     }
5927
5928 return_string_or_null:
5929     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
5930 }
5931
5932 /*
5933 =for apidoc sv_inc
5934
5935 Auto-increment of the value in the SV, doing string to numeric conversion
5936 if necessary. Handles 'get' magic.
5937
5938 =cut
5939 */
5940
5941 void
5942 Perl_sv_inc(pTHX_ register SV *sv)
5943 {
5944     register char *d;
5945     int flags;
5946
5947     if (!sv)
5948         return;
5949     SvGETMAGIC(sv);
5950     if (SvTHINKFIRST(sv)) {
5951         if (SvIsCOW(sv))
5952             sv_force_normal_flags(sv, 0);
5953         if (SvREADONLY(sv)) {
5954             if (IN_PERL_RUNTIME)
5955                 Perl_croak(aTHX_ PL_no_modify);
5956         }
5957         if (SvROK(sv)) {
5958             IV i;
5959             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
5960                 return;
5961             i = PTR2IV(SvRV(sv));
5962             sv_unref(sv);
5963             sv_setiv(sv, i);
5964         }
5965     }
5966     flags = SvFLAGS(sv);
5967     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
5968         /* It's (privately or publicly) a float, but not tested as an
5969            integer, so test it to see. */
5970         (void) SvIV(sv);
5971         flags = SvFLAGS(sv);
5972     }
5973     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
5974         /* It's publicly an integer, or privately an integer-not-float */
5975 #ifdef PERL_PRESERVE_IVUV
5976       oops_its_int:
5977 #endif
5978         if (SvIsUV(sv)) {
5979             if (SvUVX(sv) == UV_MAX)
5980                 sv_setnv(sv, UV_MAX_P1);
5981             else
5982                 (void)SvIOK_only_UV(sv);
5983                 SvUV_set(sv, SvUVX(sv) + 1);
5984         } else {
5985             if (SvIVX(sv) == IV_MAX)
5986                 sv_setuv(sv, (UV)IV_MAX + 1);
5987             else {
5988                 (void)SvIOK_only(sv);
5989                 SvIV_set(sv, SvIVX(sv) + 1);
5990             }   
5991         }
5992         return;
5993     }
5994     if (flags & SVp_NOK) {
5995         (void)SvNOK_only(sv);
5996         SvNV_set(sv, SvNVX(sv) + 1.0);
5997         return;
5998     }
5999
6000     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6001         if ((flags & SVTYPEMASK) < SVt_PVIV)
6002             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6003         (void)SvIOK_only(sv);
6004         SvIV_set(sv, 1);
6005         return;
6006     }
6007     d = SvPVX(sv);
6008     while (isALPHA(*d)) d++;
6009     while (isDIGIT(*d)) d++;
6010     if (*d) {
6011 #ifdef PERL_PRESERVE_IVUV
6012         /* Got to punt this as an integer if needs be, but we don't issue
6013            warnings. Probably ought to make the sv_iv_please() that does
6014            the conversion if possible, and silently.  */
6015         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6016         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6017             /* Need to try really hard to see if it's an integer.
6018                9.22337203685478e+18 is an integer.
6019                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6020                so $a="9.22337203685478e+18"; $a+0; $a++
6021                needs to be the same as $a="9.22337203685478e+18"; $a++
6022                or we go insane. */
6023         
6024             (void) sv_2iv(sv);
6025             if (SvIOK(sv))
6026                 goto oops_its_int;
6027
6028             /* sv_2iv *should* have made this an NV */
6029             if (flags & SVp_NOK) {
6030                 (void)SvNOK_only(sv);
6031                 SvNV_set(sv, SvNVX(sv) + 1.0);
6032                 return;
6033             }
6034             /* I don't think we can get here. Maybe I should assert this
6035                And if we do get here I suspect that sv_setnv will croak. NWC
6036                Fall through. */
6037 #if defined(USE_LONG_DOUBLE)
6038             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6039                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6040 #else
6041             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6042                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6043 #endif
6044         }
6045 #endif /* PERL_PRESERVE_IVUV */
6046         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6047         return;
6048     }
6049     d--;
6050     while (d >= SvPVX_const(sv)) {
6051         if (isDIGIT(*d)) {
6052             if (++*d <= '9')
6053                 return;
6054             *(d--) = '0';
6055         }
6056         else {
6057 #ifdef EBCDIC
6058             /* MKS: The original code here died if letters weren't consecutive.
6059              * at least it didn't have to worry about non-C locales.  The
6060              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6061              * arranged in order (although not consecutively) and that only
6062              * [A-Za-z] are accepted by isALPHA in the C locale.
6063              */
6064             if (*d != 'z' && *d != 'Z') {
6065                 do { ++*d; } while (!isALPHA(*d));
6066                 return;
6067             }
6068             *(d--) -= 'z' - 'a';
6069 #else
6070             ++*d;
6071             if (isALPHA(*d))
6072                 return;
6073             *(d--) -= 'z' - 'a' + 1;
6074 #endif
6075         }
6076     }
6077     /* oh,oh, the number grew */
6078     SvGROW(sv, SvCUR(sv) + 2);
6079     SvCUR_set(sv, SvCUR(sv) + 1);
6080     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6081         *d = d[-1];
6082     if (isDIGIT(d[1]))
6083         *d = '1';
6084     else
6085         *d = d[1];
6086 }
6087
6088 /*
6089 =for apidoc sv_dec
6090
6091 Auto-decrement of the value in the SV, doing string to numeric conversion
6092 if necessary. Handles 'get' magic.
6093
6094 =cut
6095 */
6096
6097 void
6098 Perl_sv_dec(pTHX_ register SV *sv)
6099 {
6100     int flags;
6101
6102     if (!sv)
6103         return;
6104     SvGETMAGIC(sv);
6105     if (SvTHINKFIRST(sv)) {
6106         if (SvIsCOW(sv))
6107             sv_force_normal_flags(sv, 0);
6108         if (SvREADONLY(sv)) {
6109             if (IN_PERL_RUNTIME)
6110                 Perl_croak(aTHX_ PL_no_modify);
6111         }
6112         if (SvROK(sv)) {
6113             IV i;
6114             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6115                 return;
6116             i = PTR2IV(SvRV(sv));
6117             sv_unref(sv);
6118             sv_setiv(sv, i);
6119         }
6120     }
6121     /* Unlike sv_inc we don't have to worry about string-never-numbers
6122        and keeping them magic. But we mustn't warn on punting */
6123     flags = SvFLAGS(sv);
6124     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6125         /* It's publicly an integer, or privately an integer-not-float */
6126 #ifdef PERL_PRESERVE_IVUV
6127       oops_its_int:
6128 #endif
6129         if (SvIsUV(sv)) {
6130             if (SvUVX(sv) == 0) {
6131                 (void)SvIOK_only(sv);
6132                 SvIV_set(sv, -1);
6133             }
6134             else {
6135                 (void)SvIOK_only_UV(sv);
6136                 SvUV_set(sv, SvUVX(sv) - 1);
6137             }   
6138         } else {
6139             if (SvIVX(sv) == IV_MIN)
6140                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6141             else {
6142                 (void)SvIOK_only(sv);
6143                 SvIV_set(sv, SvIVX(sv) - 1);
6144             }   
6145         }
6146         return;
6147     }
6148     if (flags & SVp_NOK) {
6149         SvNV_set(sv, SvNVX(sv) - 1.0);
6150         (void)SvNOK_only(sv);
6151         return;
6152     }
6153     if (!(flags & SVp_POK)) {
6154         if ((flags & SVTYPEMASK) < SVt_PVIV)
6155             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6156         SvIV_set(sv, -1);
6157         (void)SvIOK_only(sv);
6158         return;
6159     }
6160 #ifdef PERL_PRESERVE_IVUV
6161     {
6162         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6163         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6164             /* Need to try really hard to see if it's an integer.
6165                9.22337203685478e+18 is an integer.
6166                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6167                so $a="9.22337203685478e+18"; $a+0; $a--
6168                needs to be the same as $a="9.22337203685478e+18"; $a--
6169                or we go insane. */
6170         
6171             (void) sv_2iv(sv);
6172             if (SvIOK(sv))
6173                 goto oops_its_int;
6174
6175             /* sv_2iv *should* have made this an NV */
6176             if (flags & SVp_NOK) {
6177                 (void)SvNOK_only(sv);
6178                 SvNV_set(sv, SvNVX(sv) - 1.0);
6179                 return;
6180             }
6181             /* I don't think we can get here. Maybe I should assert this
6182                And if we do get here I suspect that sv_setnv will croak. NWC
6183                Fall through. */
6184 #if defined(USE_LONG_DOUBLE)
6185             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6186                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6187 #else
6188             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6189                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6190 #endif
6191         }
6192     }
6193 #endif /* PERL_PRESERVE_IVUV */
6194     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6195 }
6196
6197 /*
6198 =for apidoc sv_mortalcopy
6199
6200 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6201 The new SV is marked as mortal. It will be destroyed "soon", either by an
6202 explicit call to FREETMPS, or by an implicit call at places such as
6203 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6204
6205 =cut
6206 */
6207
6208 /* Make a string that will exist for the duration of the expression
6209  * evaluation.  Actually, it may have to last longer than that, but
6210  * hopefully we won't free it until it has been assigned to a
6211  * permanent location. */
6212
6213 SV *
6214 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6215 {
6216     register SV *sv;
6217
6218     new_SV(sv);
6219     sv_setsv(sv,oldstr);
6220     EXTEND_MORTAL(1);
6221     PL_tmps_stack[++PL_tmps_ix] = sv;
6222     SvTEMP_on(sv);
6223     return sv;
6224 }
6225
6226 /*
6227 =for apidoc sv_newmortal
6228
6229 Creates a new null SV which is mortal.  The reference count of the SV is
6230 set to 1. It will be destroyed "soon", either by an explicit call to
6231 FREETMPS, or by an implicit call at places such as statement boundaries.
6232 See also C<sv_mortalcopy> and C<sv_2mortal>.
6233
6234 =cut
6235 */
6236
6237 SV *
6238 Perl_sv_newmortal(pTHX)
6239 {
6240     register SV *sv;
6241
6242     new_SV(sv);
6243     SvFLAGS(sv) = SVs_TEMP;
6244     EXTEND_MORTAL(1);
6245     PL_tmps_stack[++PL_tmps_ix] = sv;
6246     return sv;
6247 }
6248
6249 /*
6250 =for apidoc sv_2mortal
6251
6252 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6253 by an explicit call to FREETMPS, or by an implicit call at places such as
6254 statement boundaries.  SvTEMP() is turned on which means that the SV's
6255 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6256 and C<sv_mortalcopy>.
6257
6258 =cut
6259 */
6260
6261 SV *
6262 Perl_sv_2mortal(pTHX_ register SV *sv)
6263 {
6264     dVAR;
6265     if (!sv)
6266         return sv;
6267     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6268         return sv;
6269     EXTEND_MORTAL(1);
6270     PL_tmps_stack[++PL_tmps_ix] = sv;
6271     SvTEMP_on(sv);
6272     return sv;
6273 }
6274
6275 /*
6276 =for apidoc newSVpv
6277
6278 Creates a new SV and copies a string into it.  The reference count for the
6279 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6280 strlen().  For efficiency, consider using C<newSVpvn> instead.
6281
6282 =cut
6283 */
6284
6285 SV *
6286 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6287 {
6288     register SV *sv;
6289
6290     new_SV(sv);
6291     sv_setpvn(sv,s,len ? len : strlen(s));
6292     return sv;
6293 }
6294
6295 /*
6296 =for apidoc newSVpvn
6297
6298 Creates a new SV and copies a string into it.  The reference count for the
6299 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6300 string.  You are responsible for ensuring that the source string is at least
6301 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6302
6303 =cut
6304 */
6305
6306 SV *
6307 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6308 {
6309     register SV *sv;
6310
6311     new_SV(sv);
6312     sv_setpvn(sv,s,len);
6313     return sv;
6314 }
6315
6316
6317 /*
6318 =for apidoc newSVhek
6319
6320 Creates a new SV from the hash key structure.  It will generate scalars that
6321 point to the shared string table where possible. Returns a new (undefined)
6322 SV if the hek is NULL.
6323
6324 =cut
6325 */
6326
6327 SV *
6328 Perl_newSVhek(pTHX_ const HEK *hek)
6329 {
6330     if (!hek) {
6331         SV *sv;
6332
6333         new_SV(sv);
6334         return sv;
6335     }
6336
6337     if (HEK_LEN(hek) == HEf_SVKEY) {
6338         return newSVsv(*(SV**)HEK_KEY(hek));
6339     } else {
6340         const int flags = HEK_FLAGS(hek);
6341         if (flags & HVhek_WASUTF8) {
6342             /* Trouble :-)
6343                Andreas would like keys he put in as utf8 to come back as utf8
6344             */
6345             STRLEN utf8_len = HEK_LEN(hek);
6346             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6347             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6348
6349             SvUTF8_on (sv);
6350             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6351             return sv;
6352         } else if (flags & HVhek_REHASH) {
6353             /* We don't have a pointer to the hv, so we have to replicate the
6354                flag into every HEK. This hv is using custom a hasing
6355                algorithm. Hence we can't return a shared string scalar, as
6356                that would contain the (wrong) hash value, and might get passed
6357                into an hv routine with a regular hash  */
6358
6359             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6360             if (HEK_UTF8(hek))
6361                 SvUTF8_on (sv);
6362             return sv;
6363         }
6364         /* This will be overwhelminly the most common case.  */
6365         return newSVpvn_share(HEK_KEY(hek),
6366                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6367                               HEK_HASH(hek));
6368     }
6369 }
6370
6371 /*
6372 =for apidoc newSVpvn_share
6373
6374 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6375 table. If the string does not already exist in the table, it is created
6376 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6377 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6378 otherwise the hash is computed.  The idea here is that as the string table
6379 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6380 hash lookup will avoid string compare.
6381
6382 =cut
6383 */
6384
6385 SV *
6386 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6387 {
6388     register SV *sv;
6389     bool is_utf8 = FALSE;
6390     if (len < 0) {
6391         STRLEN tmplen = -len;
6392         is_utf8 = TRUE;
6393         /* See the note in hv.c:hv_fetch() --jhi */
6394         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6395         len = tmplen;
6396     }
6397     if (!hash)
6398         PERL_HASH(hash, src, len);
6399     new_SV(sv);
6400     sv_upgrade(sv, SVt_PV);
6401     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6402     SvCUR_set(sv, len);
6403     SvLEN_set(sv, 0);
6404     SvREADONLY_on(sv);
6405     SvFAKE_on(sv);
6406     SvPOK_on(sv);
6407     if (is_utf8)
6408         SvUTF8_on(sv);
6409     return sv;
6410 }
6411
6412
6413 #if defined(PERL_IMPLICIT_CONTEXT)
6414
6415 /* pTHX_ magic can't cope with varargs, so this is a no-context
6416  * version of the main function, (which may itself be aliased to us).
6417  * Don't access this version directly.
6418  */
6419
6420 SV *
6421 Perl_newSVpvf_nocontext(const char* pat, ...)
6422 {
6423     dTHX;
6424     register SV *sv;
6425     va_list args;
6426     va_start(args, pat);
6427     sv = vnewSVpvf(pat, &args);
6428     va_end(args);
6429     return sv;
6430 }
6431 #endif
6432
6433 /*
6434 =for apidoc newSVpvf
6435
6436 Creates a new SV and initializes it with the string formatted like
6437 C<sprintf>.
6438
6439 =cut
6440 */
6441
6442 SV *
6443 Perl_newSVpvf(pTHX_ const char* pat, ...)
6444 {
6445     register SV *sv;
6446     va_list args;
6447     va_start(args, pat);
6448     sv = vnewSVpvf(pat, &args);
6449     va_end(args);
6450     return sv;
6451 }
6452
6453 /* backend for newSVpvf() and newSVpvf_nocontext() */
6454
6455 SV *
6456 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6457 {
6458     register SV *sv;
6459     new_SV(sv);
6460     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6461     return sv;
6462 }
6463
6464 /*
6465 =for apidoc newSVnv
6466
6467 Creates a new SV and copies a floating point value into it.
6468 The reference count for the SV is set to 1.
6469
6470 =cut
6471 */
6472
6473 SV *
6474 Perl_newSVnv(pTHX_ NV n)
6475 {
6476     register SV *sv;
6477
6478     new_SV(sv);
6479     sv_setnv(sv,n);
6480     return sv;
6481 }
6482
6483 /*
6484 =for apidoc newSViv
6485
6486 Creates a new SV and copies an integer into it.  The reference count for the
6487 SV is set to 1.
6488
6489 =cut
6490 */
6491
6492 SV *
6493 Perl_newSViv(pTHX_ IV i)
6494 {
6495     register SV *sv;
6496
6497     new_SV(sv);
6498     sv_setiv(sv,i);
6499     return sv;
6500 }
6501
6502 /*
6503 =for apidoc newSVuv
6504
6505 Creates a new SV and copies an unsigned integer into it.
6506 The reference count for the SV is set to 1.
6507
6508 =cut
6509 */
6510
6511 SV *
6512 Perl_newSVuv(pTHX_ UV u)
6513 {
6514     register SV *sv;
6515
6516     new_SV(sv);
6517     sv_setuv(sv,u);
6518     return sv;
6519 }
6520
6521 /*
6522 =for apidoc newRV_noinc
6523
6524 Creates an RV wrapper for an SV.  The reference count for the original
6525 SV is B<not> incremented.
6526
6527 =cut
6528 */
6529
6530 SV *
6531 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6532 {
6533     register SV *sv;
6534
6535     new_SV(sv);
6536     sv_upgrade(sv, SVt_RV);
6537     SvTEMP_off(tmpRef);
6538     SvRV_set(sv, tmpRef);
6539     SvROK_on(sv);
6540     return sv;
6541 }
6542
6543 /* newRV_inc is the official function name to use now.
6544  * newRV_inc is in fact #defined to newRV in sv.h
6545  */
6546
6547 SV *
6548 Perl_newRV(pTHX_ SV *tmpRef)
6549 {
6550     return newRV_noinc(SvREFCNT_inc(tmpRef));
6551 }
6552
6553 /*
6554 =for apidoc newSVsv
6555
6556 Creates a new SV which is an exact duplicate of the original SV.
6557 (Uses C<sv_setsv>).
6558
6559 =cut
6560 */
6561
6562 SV *
6563 Perl_newSVsv(pTHX_ register SV *old)
6564 {
6565     register SV *sv;
6566
6567     if (!old)
6568         return Nullsv;
6569     if (SvTYPE(old) == SVTYPEMASK) {
6570         if (ckWARN_d(WARN_INTERNAL))
6571             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6572         return Nullsv;
6573     }
6574     new_SV(sv);
6575     /* SV_GMAGIC is the default for sv_setv()
6576        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6577        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6578     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6579     return sv;
6580 }
6581
6582 /*
6583 =for apidoc sv_reset
6584
6585 Underlying implementation for the C<reset> Perl function.
6586 Note that the perl-level function is vaguely deprecated.
6587
6588 =cut
6589 */
6590
6591 void
6592 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6593 {
6594     dVAR;
6595     char todo[PERL_UCHAR_MAX+1];
6596
6597     if (!stash)
6598         return;
6599
6600     if (!*s) {          /* reset ?? searches */
6601         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6602         if (mg) {
6603             PMOP *pm = (PMOP *) mg->mg_obj;
6604             while (pm) {
6605                 pm->op_pmdynflags &= ~PMdf_USED;
6606                 pm = pm->op_pmnext;
6607             }
6608         }
6609         return;
6610     }
6611
6612     /* reset variables */
6613
6614     if (!HvARRAY(stash))
6615         return;
6616
6617     Zero(todo, 256, char);
6618     while (*s) {
6619         I32 max;
6620         I32 i = (unsigned char)*s;
6621         if (s[1] == '-') {
6622             s += 2;
6623         }
6624         max = (unsigned char)*s++;
6625         for ( ; i <= max; i++) {
6626             todo[i] = 1;
6627         }
6628         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6629             HE *entry;
6630             for (entry = HvARRAY(stash)[i];
6631                  entry;
6632                  entry = HeNEXT(entry))
6633             {
6634                 register GV *gv;
6635                 register SV *sv;
6636
6637                 if (!todo[(U8)*HeKEY(entry)])
6638                     continue;
6639                 gv = (GV*)HeVAL(entry);
6640                 sv = GvSV(gv);
6641                 if (sv) {
6642                     if (SvTHINKFIRST(sv)) {
6643                         if (!SvREADONLY(sv) && SvROK(sv))
6644                             sv_unref(sv);
6645                         /* XXX Is this continue a bug? Why should THINKFIRST
6646                            exempt us from resetting arrays and hashes?  */
6647                         continue;
6648                     }
6649                     SvOK_off(sv);
6650                     if (SvTYPE(sv) >= SVt_PV) {
6651                         SvCUR_set(sv, 0);
6652                         if (SvPVX_const(sv) != Nullch)
6653                             *SvPVX(sv) = '\0';
6654                         SvTAINT(sv);
6655                     }
6656                 }
6657                 if (GvAV(gv)) {
6658                     av_clear(GvAV(gv));
6659                 }
6660                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6661 #if defined(VMS)
6662                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6663 #else /* ! VMS */
6664                     hv_clear(GvHV(gv));
6665 #  if defined(USE_ENVIRON_ARRAY)
6666                     if (gv == PL_envgv)
6667                         my_clearenv();
6668 #  endif /* USE_ENVIRON_ARRAY */
6669 #endif /* VMS */
6670                 }
6671             }
6672         }
6673     }
6674 }
6675
6676 /*
6677 =for apidoc sv_2io
6678
6679 Using various gambits, try to get an IO from an SV: the IO slot if its a
6680 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6681 named after the PV if we're a string.
6682
6683 =cut
6684 */
6685
6686 IO*
6687 Perl_sv_2io(pTHX_ SV *sv)
6688 {
6689     IO* io;
6690     GV* gv;
6691
6692     switch (SvTYPE(sv)) {
6693     case SVt_PVIO:
6694         io = (IO*)sv;
6695         break;
6696     case SVt_PVGV:
6697         gv = (GV*)sv;
6698         io = GvIO(gv);
6699         if (!io)
6700             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6701         break;
6702     default:
6703         if (!SvOK(sv))
6704             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6705         if (SvROK(sv))
6706             return sv_2io(SvRV(sv));
6707         gv = gv_fetchsv(sv, 0, SVt_PVIO);
6708         if (gv)
6709             io = GvIO(gv);
6710         else
6711             io = 0;
6712         if (!io)
6713             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6714         break;
6715     }
6716     return io;
6717 }
6718
6719 /*
6720 =for apidoc sv_2cv
6721
6722 Using various gambits, try to get a CV from an SV; in addition, try if
6723 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6724 The flags in C<lref> are passed to sv_fetchsv.
6725
6726 =cut
6727 */
6728
6729 CV *
6730 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6731 {
6732     dVAR;
6733     GV *gv = Nullgv;
6734     CV *cv = Nullcv;
6735
6736     if (!sv)
6737         return *st = NULL, *gvp = Nullgv, Nullcv;
6738     switch (SvTYPE(sv)) {
6739     case SVt_PVCV:
6740         *st = CvSTASH(sv);
6741         *gvp = Nullgv;
6742         return (CV*)sv;
6743     case SVt_PVHV:
6744     case SVt_PVAV:
6745         *st = NULL;
6746         *gvp = Nullgv;
6747         return Nullcv;
6748     case SVt_PVGV:
6749         gv = (GV*)sv;
6750         *gvp = gv;
6751         *st = GvESTASH(gv);
6752         goto fix_gv;
6753
6754     default:
6755         SvGETMAGIC(sv);
6756         if (SvROK(sv)) {
6757             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6758             tryAMAGICunDEREF(to_cv);
6759
6760             sv = SvRV(sv);
6761             if (SvTYPE(sv) == SVt_PVCV) {
6762                 cv = (CV*)sv;
6763                 *gvp = Nullgv;
6764                 *st = CvSTASH(cv);
6765                 return cv;
6766             }
6767             else if(isGV(sv))
6768                 gv = (GV*)sv;
6769             else
6770                 Perl_croak(aTHX_ "Not a subroutine reference");
6771         }
6772         else if (isGV(sv))
6773             gv = (GV*)sv;
6774         else
6775             gv = gv_fetchsv(sv, lref, SVt_PVCV);
6776         *gvp = gv;
6777         if (!gv) {
6778             *st = NULL;
6779             return Nullcv;
6780         }
6781         /* Some flags to gv_fetchsv mean don't really create the GV  */
6782         if (SvTYPE(gv) != SVt_PVGV) {
6783             *st = NULL;
6784             return NULL;
6785         }
6786         *st = GvESTASH(gv);
6787     fix_gv:
6788         if (lref && !GvCVu(gv)) {
6789             SV *tmpsv;
6790             ENTER;
6791             tmpsv = NEWSV(704,0);
6792             gv_efullname3(tmpsv, gv, Nullch);
6793             /* XXX this is probably not what they think they're getting.
6794              * It has the same effect as "sub name;", i.e. just a forward
6795              * declaration! */
6796             newSUB(start_subparse(FALSE, 0),
6797                    newSVOP(OP_CONST, 0, tmpsv),
6798                    Nullop,
6799                    Nullop);
6800             LEAVE;
6801             if (!GvCVu(gv))
6802                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
6803                            sv);
6804         }
6805         return GvCVu(gv);
6806     }
6807 }
6808
6809 /*
6810 =for apidoc sv_true
6811
6812 Returns true if the SV has a true value by Perl's rules.
6813 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
6814 instead use an in-line version.
6815
6816 =cut
6817 */
6818
6819 I32
6820 Perl_sv_true(pTHX_ register SV *sv)
6821 {
6822     if (!sv)
6823         return 0;
6824     if (SvPOK(sv)) {
6825         register const XPV* const tXpv = (XPV*)SvANY(sv);
6826         if (tXpv &&
6827                 (tXpv->xpv_cur > 1 ||
6828                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
6829             return 1;
6830         else
6831             return 0;
6832     }
6833     else {
6834         if (SvIOK(sv))
6835             return SvIVX(sv) != 0;
6836         else {
6837             if (SvNOK(sv))
6838                 return SvNVX(sv) != 0.0;
6839             else
6840                 return sv_2bool(sv);
6841         }
6842     }
6843 }
6844
6845 /*
6846 =for apidoc sv_pvn_force
6847
6848 Get a sensible string out of the SV somehow.
6849 A private implementation of the C<SvPV_force> macro for compilers which
6850 can't cope with complex macro expressions. Always use the macro instead.
6851
6852 =for apidoc sv_pvn_force_flags
6853
6854 Get a sensible string out of the SV somehow.
6855 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
6856 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
6857 implemented in terms of this function.
6858 You normally want to use the various wrapper macros instead: see
6859 C<SvPV_force> and C<SvPV_force_nomg>
6860
6861 =cut
6862 */
6863
6864 char *
6865 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
6866 {
6867
6868     if (SvTHINKFIRST(sv) && !SvROK(sv))
6869         sv_force_normal_flags(sv, 0);
6870
6871     if (SvPOK(sv)) {
6872         if (lp)
6873             *lp = SvCUR(sv);
6874     }
6875     else {
6876         char *s;
6877         STRLEN len;
6878  
6879         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
6880             const char * const ref = sv_reftype(sv,0);
6881             if (PL_op)
6882                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
6883                            ref, OP_NAME(PL_op));
6884             else
6885                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
6886         }
6887         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
6888             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
6889                 OP_NAME(PL_op));
6890         s = sv_2pv_flags(sv, &len, flags);
6891         if (lp)
6892             *lp = len;
6893
6894         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
6895             if (SvROK(sv))
6896                 sv_unref(sv);
6897             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
6898             SvGROW(sv, len + 1);
6899             Move(s,SvPVX(sv),len,char);
6900             SvCUR_set(sv, len);
6901             *SvEND(sv) = '\0';
6902         }
6903         if (!SvPOK(sv)) {
6904             SvPOK_on(sv);               /* validate pointer */
6905             SvTAINT(sv);
6906             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
6907                                   PTR2UV(sv),SvPVX_const(sv)));
6908         }
6909     }
6910     return SvPVX_mutable(sv);
6911 }
6912
6913 /*
6914 =for apidoc sv_pvbyten_force
6915
6916 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
6917
6918 =cut
6919 */
6920
6921 char *
6922 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
6923 {
6924     sv_pvn_force(sv,lp);
6925     sv_utf8_downgrade(sv,0);
6926     *lp = SvCUR(sv);
6927     return SvPVX(sv);
6928 }
6929
6930 /*
6931 =for apidoc sv_pvutf8n_force
6932
6933 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
6934
6935 =cut
6936 */
6937
6938 char *
6939 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
6940 {
6941     sv_pvn_force(sv,lp);
6942     sv_utf8_upgrade(sv);
6943     *lp = SvCUR(sv);
6944     return SvPVX(sv);
6945 }
6946
6947 /*
6948 =for apidoc sv_reftype
6949
6950 Returns a string describing what the SV is a reference to.
6951
6952 =cut
6953 */
6954
6955 char *
6956 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
6957 {
6958     /* The fact that I don't need to downcast to char * everywhere, only in ?:
6959        inside return suggests a const propagation bug in g++.  */
6960     if (ob && SvOBJECT(sv)) {
6961         char * const name = HvNAME_get(SvSTASH(sv));
6962         return name ? name : (char *) "__ANON__";
6963     }
6964     else {
6965         switch (SvTYPE(sv)) {
6966         case SVt_NULL:
6967         case SVt_IV:
6968         case SVt_NV:
6969         case SVt_RV:
6970         case SVt_PV:
6971         case SVt_PVIV:
6972         case SVt_PVNV:
6973         case SVt_PVMG:
6974         case SVt_PVBM:
6975                                 if (SvVOK(sv))
6976                                     return "VSTRING";
6977                                 if (SvROK(sv))
6978                                     return "REF";
6979                                 else
6980                                     return "SCALAR";
6981
6982         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
6983                                 /* tied lvalues should appear to be
6984                                  * scalars for backwards compatitbility */
6985                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
6986                                     ? "SCALAR" : "LVALUE");
6987         case SVt_PVAV:          return "ARRAY";
6988         case SVt_PVHV:          return "HASH";
6989         case SVt_PVCV:          return "CODE";
6990         case SVt_PVGV:          return "GLOB";
6991         case SVt_PVFM:          return "FORMAT";
6992         case SVt_PVIO:          return "IO";
6993         default:                return "UNKNOWN";
6994         }
6995     }
6996 }
6997
6998 /*
6999 =for apidoc sv_isobject
7000
7001 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7002 object.  If the SV is not an RV, or if the object is not blessed, then this
7003 will return false.
7004
7005 =cut
7006 */
7007
7008 int
7009 Perl_sv_isobject(pTHX_ SV *sv)
7010 {
7011     if (!sv)
7012         return 0;
7013     SvGETMAGIC(sv);
7014     if (!SvROK(sv))
7015         return 0;
7016     sv = (SV*)SvRV(sv);
7017     if (!SvOBJECT(sv))
7018         return 0;
7019     return 1;
7020 }
7021
7022 /*
7023 =for apidoc sv_isa
7024
7025 Returns a boolean indicating whether the SV is blessed into the specified
7026 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7027 an inheritance relationship.
7028
7029 =cut
7030 */
7031
7032 int
7033 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7034 {
7035     const char *hvname;
7036     if (!sv)
7037         return 0;
7038     SvGETMAGIC(sv);
7039     if (!SvROK(sv))
7040         return 0;
7041     sv = (SV*)SvRV(sv);
7042     if (!SvOBJECT(sv))
7043         return 0;
7044     hvname = HvNAME_get(SvSTASH(sv));
7045     if (!hvname)
7046         return 0;
7047
7048     return strEQ(hvname, name);
7049 }
7050
7051 /*
7052 =for apidoc newSVrv
7053
7054 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7055 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7056 be blessed in the specified package.  The new SV is returned and its
7057 reference count is 1.
7058
7059 =cut
7060 */
7061
7062 SV*
7063 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7064 {
7065     SV *sv;
7066
7067     new_SV(sv);
7068
7069     SV_CHECK_THINKFIRST_COW_DROP(rv);
7070     SvAMAGIC_off(rv);
7071
7072     if (SvTYPE(rv) >= SVt_PVMG) {
7073         const U32 refcnt = SvREFCNT(rv);
7074         SvREFCNT(rv) = 0;
7075         sv_clear(rv);
7076         SvFLAGS(rv) = 0;
7077         SvREFCNT(rv) = refcnt;
7078     }
7079
7080     if (SvTYPE(rv) < SVt_RV)
7081         sv_upgrade(rv, SVt_RV);
7082     else if (SvTYPE(rv) > SVt_RV) {
7083         SvPV_free(rv);
7084         SvCUR_set(rv, 0);
7085         SvLEN_set(rv, 0);
7086     }
7087
7088     SvOK_off(rv);
7089     SvRV_set(rv, sv);
7090     SvROK_on(rv);
7091
7092     if (classname) {
7093         HV* const stash = gv_stashpv(classname, TRUE);
7094         (void)sv_bless(rv, stash);
7095     }
7096     return sv;
7097 }
7098
7099 /*
7100 =for apidoc sv_setref_pv
7101
7102 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7103 argument will be upgraded to an RV.  That RV will be modified to point to
7104 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7105 into the SV.  The C<classname> argument indicates the package for the
7106 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7107 will have a reference count of 1, and the RV will be returned.
7108
7109 Do not use with other Perl types such as HV, AV, SV, CV, because those
7110 objects will become corrupted by the pointer copy process.
7111
7112 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7113
7114 =cut
7115 */
7116
7117 SV*
7118 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7119 {
7120     if (!pv) {
7121         sv_setsv(rv, &PL_sv_undef);
7122         SvSETMAGIC(rv);
7123     }
7124     else
7125         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7126     return rv;
7127 }
7128
7129 /*
7130 =for apidoc sv_setref_iv
7131
7132 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7133 argument will be upgraded to an RV.  That RV will be modified to point to
7134 the new SV.  The C<classname> argument indicates the package for the
7135 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7136 will have a reference count of 1, and the RV will be returned.
7137
7138 =cut
7139 */
7140
7141 SV*
7142 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7143 {
7144     sv_setiv(newSVrv(rv,classname), iv);
7145     return rv;
7146 }
7147
7148 /*
7149 =for apidoc sv_setref_uv
7150
7151 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7152 argument will be upgraded to an RV.  That RV will be modified to point to
7153 the new SV.  The C<classname> argument indicates the package for the
7154 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7155 will have a reference count of 1, and the RV will be returned.
7156
7157 =cut
7158 */
7159
7160 SV*
7161 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7162 {
7163     sv_setuv(newSVrv(rv,classname), uv);
7164     return rv;
7165 }
7166
7167 /*
7168 =for apidoc sv_setref_nv
7169
7170 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7171 argument will be upgraded to an RV.  That RV will be modified to point to
7172 the new SV.  The C<classname> argument indicates the package for the
7173 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7174 will have a reference count of 1, and the RV will be returned.
7175
7176 =cut
7177 */
7178
7179 SV*
7180 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7181 {
7182     sv_setnv(newSVrv(rv,classname), nv);
7183     return rv;
7184 }
7185
7186 /*
7187 =for apidoc sv_setref_pvn
7188
7189 Copies a string into a new SV, optionally blessing the SV.  The length of the
7190 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7191 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7192 argument indicates the package for the blessing.  Set C<classname> to
7193 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7194 of 1, and the RV will be returned.
7195
7196 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7197
7198 =cut
7199 */
7200
7201 SV*
7202 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7203 {
7204     sv_setpvn(newSVrv(rv,classname), pv, n);
7205     return rv;
7206 }
7207
7208 /*
7209 =for apidoc sv_bless
7210
7211 Blesses an SV into a specified package.  The SV must be an RV.  The package
7212 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7213 of the SV is unaffected.
7214
7215 =cut
7216 */
7217
7218 SV*
7219 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7220 {
7221     SV *tmpRef;
7222     if (!SvROK(sv))
7223         Perl_croak(aTHX_ "Can't bless non-reference value");
7224     tmpRef = SvRV(sv);
7225     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7226         if (SvREADONLY(tmpRef))
7227             Perl_croak(aTHX_ PL_no_modify);
7228         if (SvOBJECT(tmpRef)) {
7229             if (SvTYPE(tmpRef) != SVt_PVIO)
7230                 --PL_sv_objcount;
7231             SvREFCNT_dec(SvSTASH(tmpRef));
7232         }
7233     }
7234     SvOBJECT_on(tmpRef);
7235     if (SvTYPE(tmpRef) != SVt_PVIO)
7236         ++PL_sv_objcount;
7237     SvUPGRADE(tmpRef, SVt_PVMG);
7238     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7239
7240     if (Gv_AMG(stash))
7241         SvAMAGIC_on(sv);
7242     else
7243         SvAMAGIC_off(sv);
7244
7245     if(SvSMAGICAL(tmpRef))
7246         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7247             mg_set(tmpRef);
7248
7249
7250
7251     return sv;
7252 }
7253
7254 /* Downgrades a PVGV to a PVMG.
7255  */
7256
7257 STATIC void
7258 S_sv_unglob(pTHX_ SV *sv)
7259 {
7260     void *xpvmg;
7261
7262     assert(SvTYPE(sv) == SVt_PVGV);
7263     SvFAKE_off(sv);
7264     if (GvGP(sv))
7265         gp_free((GV*)sv);
7266     if (GvSTASH(sv)) {
7267         sv_del_backref((SV*)GvSTASH(sv), sv);
7268         GvSTASH(sv) = NULL;
7269     }
7270     sv_unmagic(sv, PERL_MAGIC_glob);
7271     Safefree(GvNAME(sv));
7272     GvMULTI_off(sv);
7273
7274     /* need to keep SvANY(sv) in the right arena */
7275     xpvmg = new_XPVMG();
7276     StructCopy(SvANY(sv), xpvmg, XPVMG);
7277     del_XPVGV(SvANY(sv));
7278     SvANY(sv) = xpvmg;
7279
7280     SvFLAGS(sv) &= ~SVTYPEMASK;
7281     SvFLAGS(sv) |= SVt_PVMG;
7282 }
7283
7284 /*
7285 =for apidoc sv_unref_flags
7286
7287 Unsets the RV status of the SV, and decrements the reference count of
7288 whatever was being referenced by the RV.  This can almost be thought of
7289 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7290 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7291 (otherwise the decrementing is conditional on the reference count being
7292 different from one or the reference being a readonly SV).
7293 See C<SvROK_off>.
7294
7295 =cut
7296 */
7297
7298 void
7299 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7300 {
7301     SV* const target = SvRV(ref);
7302
7303     if (SvWEAKREF(ref)) {
7304         sv_del_backref(target, ref);
7305         SvWEAKREF_off(ref);
7306         SvRV_set(ref, NULL);
7307         return;
7308     }
7309     SvRV_set(ref, NULL);
7310     SvROK_off(ref);
7311     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7312        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7313     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7314         SvREFCNT_dec(target);
7315     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7316         sv_2mortal(target);     /* Schedule for freeing later */
7317 }
7318
7319 /*
7320 =for apidoc sv_untaint
7321
7322 Untaint an SV. Use C<SvTAINTED_off> instead.
7323 =cut
7324 */
7325
7326 void
7327 Perl_sv_untaint(pTHX_ SV *sv)
7328 {
7329     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7330         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7331         if (mg)
7332             mg->mg_len &= ~1;
7333     }
7334 }
7335
7336 /*
7337 =for apidoc sv_tainted
7338
7339 Test an SV for taintedness. Use C<SvTAINTED> instead.
7340 =cut
7341 */
7342
7343 bool
7344 Perl_sv_tainted(pTHX_ SV *sv)
7345 {
7346     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7347         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7348         if (mg && (mg->mg_len & 1) )
7349             return TRUE;
7350     }
7351     return FALSE;
7352 }
7353
7354 /*
7355 =for apidoc sv_setpviv
7356
7357 Copies an integer into the given SV, also updating its string value.
7358 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7359
7360 =cut
7361 */
7362
7363 void
7364 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7365 {
7366     char buf[TYPE_CHARS(UV)];
7367     char *ebuf;
7368     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7369
7370     sv_setpvn(sv, ptr, ebuf - ptr);
7371 }
7372
7373 /*
7374 =for apidoc sv_setpviv_mg
7375
7376 Like C<sv_setpviv>, but also handles 'set' magic.
7377
7378 =cut
7379 */
7380
7381 void
7382 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7383 {
7384     sv_setpviv(sv, iv);
7385     SvSETMAGIC(sv);
7386 }
7387
7388 #if defined(PERL_IMPLICIT_CONTEXT)
7389
7390 /* pTHX_ magic can't cope with varargs, so this is a no-context
7391  * version of the main function, (which may itself be aliased to us).
7392  * Don't access this version directly.
7393  */
7394
7395 void
7396 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7397 {
7398     dTHX;
7399     va_list args;
7400     va_start(args, pat);
7401     sv_vsetpvf(sv, pat, &args);
7402     va_end(args);
7403 }
7404
7405 /* pTHX_ magic can't cope with varargs, so this is a no-context
7406  * version of the main function, (which may itself be aliased to us).
7407  * Don't access this version directly.
7408  */
7409
7410 void
7411 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7412 {
7413     dTHX;
7414     va_list args;
7415     va_start(args, pat);
7416     sv_vsetpvf_mg(sv, pat, &args);
7417     va_end(args);
7418 }
7419 #endif
7420
7421 /*
7422 =for apidoc sv_setpvf
7423
7424 Works like C<sv_catpvf> but copies the text into the SV instead of
7425 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7426
7427 =cut
7428 */
7429
7430 void
7431 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7432 {
7433     va_list args;
7434     va_start(args, pat);
7435     sv_vsetpvf(sv, pat, &args);
7436     va_end(args);
7437 }
7438
7439 /*
7440 =for apidoc sv_vsetpvf
7441
7442 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7443 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7444
7445 Usually used via its frontend C<sv_setpvf>.
7446
7447 =cut
7448 */
7449
7450 void
7451 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7452 {
7453     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7454 }
7455
7456 /*
7457 =for apidoc sv_setpvf_mg
7458
7459 Like C<sv_setpvf>, but also handles 'set' magic.
7460
7461 =cut
7462 */
7463
7464 void
7465 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7466 {
7467     va_list args;
7468     va_start(args, pat);
7469     sv_vsetpvf_mg(sv, pat, &args);
7470     va_end(args);
7471 }
7472
7473 /*
7474 =for apidoc sv_vsetpvf_mg
7475
7476 Like C<sv_vsetpvf>, but also handles 'set' magic.
7477
7478 Usually used via its frontend C<sv_setpvf_mg>.
7479
7480 =cut
7481 */
7482
7483 void
7484 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7485 {
7486     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7487     SvSETMAGIC(sv);
7488 }
7489
7490 #if defined(PERL_IMPLICIT_CONTEXT)
7491
7492 /* pTHX_ magic can't cope with varargs, so this is a no-context
7493  * version of the main function, (which may itself be aliased to us).
7494  * Don't access this version directly.
7495  */
7496
7497 void
7498 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7499 {
7500     dTHX;
7501     va_list args;
7502     va_start(args, pat);
7503     sv_vcatpvf(sv, pat, &args);
7504     va_end(args);
7505 }
7506
7507 /* pTHX_ magic can't cope with varargs, so this is a no-context
7508  * version of the main function, (which may itself be aliased to us).
7509  * Don't access this version directly.
7510  */
7511
7512 void
7513 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7514 {
7515     dTHX;
7516     va_list args;
7517     va_start(args, pat);
7518     sv_vcatpvf_mg(sv, pat, &args);
7519     va_end(args);
7520 }
7521 #endif
7522
7523 /*
7524 =for apidoc sv_catpvf
7525
7526 Processes its arguments like C<sprintf> and appends the formatted
7527 output to an SV.  If the appended data contains "wide" characters
7528 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7529 and characters >255 formatted with %c), the original SV might get
7530 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7531 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7532 valid UTF-8; if the original SV was bytes, the pattern should be too.
7533
7534 =cut */
7535
7536 void
7537 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7538 {
7539     va_list args;
7540     va_start(args, pat);
7541     sv_vcatpvf(sv, pat, &args);
7542     va_end(args);
7543 }
7544
7545 /*
7546 =for apidoc sv_vcatpvf
7547
7548 Processes its arguments like C<vsprintf> and appends the formatted output
7549 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7550
7551 Usually used via its frontend C<sv_catpvf>.
7552
7553 =cut
7554 */
7555
7556 void
7557 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7558 {
7559     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7560 }
7561
7562 /*
7563 =for apidoc sv_catpvf_mg
7564
7565 Like C<sv_catpvf>, but also handles 'set' magic.
7566
7567 =cut
7568 */
7569
7570 void
7571 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7572 {
7573     va_list args;
7574     va_start(args, pat);
7575     sv_vcatpvf_mg(sv, pat, &args);
7576     va_end(args);
7577 }
7578
7579 /*
7580 =for apidoc sv_vcatpvf_mg
7581
7582 Like C<sv_vcatpvf>, but also handles 'set' magic.
7583
7584 Usually used via its frontend C<sv_catpvf_mg>.
7585
7586 =cut
7587 */
7588
7589 void
7590 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7591 {
7592     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7593     SvSETMAGIC(sv);
7594 }
7595
7596 /*
7597 =for apidoc sv_vsetpvfn
7598
7599 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7600 appending it.
7601
7602 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7603
7604 =cut
7605 */
7606
7607 void
7608 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7609 {
7610     sv_setpvn(sv, "", 0);
7611     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7612 }
7613
7614 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7615
7616 STATIC I32
7617 S_expect_number(pTHX_ char** pattern)
7618 {
7619     I32 var = 0;
7620     switch (**pattern) {
7621     case '1': case '2': case '3':
7622     case '4': case '5': case '6':
7623     case '7': case '8': case '9':
7624         var = *(*pattern)++ - '0';
7625         while (isDIGIT(**pattern)) {
7626             I32 tmp = var * 10 + (*(*pattern)++ - '0');
7627             if (tmp < var)
7628                 Perl_croak(aTHX_ "Integer overflow in format string for %s", (PL_op ? OP_NAME(PL_op) : "sv_vcatpvfn"));
7629             var = tmp;
7630         }
7631     }
7632     return var;
7633 }
7634 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7635
7636 static char *
7637 F0convert(NV nv, char *endbuf, STRLEN *len)
7638 {
7639     const int neg = nv < 0;
7640     UV uv;
7641
7642     if (neg)
7643         nv = -nv;
7644     if (nv < UV_MAX) {
7645         char *p = endbuf;
7646         nv += 0.5;
7647         uv = (UV)nv;
7648         if (uv & 1 && uv == nv)
7649             uv--;                       /* Round to even */
7650         do {
7651             const unsigned dig = uv % 10;
7652             *--p = '0' + dig;
7653         } while (uv /= 10);
7654         if (neg)
7655             *--p = '-';
7656         *len = endbuf - p;
7657         return p;
7658     }
7659     return Nullch;
7660 }
7661
7662
7663 /*
7664 =for apidoc sv_vcatpvfn
7665
7666 Processes its arguments like C<vsprintf> and appends the formatted output
7667 to an SV.  Uses an array of SVs if the C style variable argument list is
7668 missing (NULL).  When running with taint checks enabled, indicates via
7669 C<maybe_tainted> if results are untrustworthy (often due to the use of
7670 locales).
7671
7672 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7673
7674 =cut
7675 */
7676
7677
7678 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7679                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7680                         vec_utf8 = DO_UTF8(vecsv);
7681
7682 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7683
7684 void
7685 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7686 {
7687     char *p;
7688     char *q;
7689     const char *patend;
7690     STRLEN origlen;
7691     I32 svix = 0;
7692     static const char nullstr[] = "(null)";
7693     SV *argsv = Nullsv;
7694     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7695     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7696     SV *nsv = Nullsv;
7697     /* Times 4: a decimal digit takes more than 3 binary digits.
7698      * NV_DIG: mantissa takes than many decimal digits.
7699      * Plus 32: Playing safe. */
7700     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7701     /* large enough for "%#.#f" --chip */
7702     /* what about long double NVs? --jhi */
7703
7704     PERL_UNUSED_ARG(maybe_tainted);
7705
7706     /* no matter what, this is a string now */
7707     (void)SvPV_force(sv, origlen);
7708
7709     /* special-case "", "%s", and "%-p" (SVf - see below) */
7710     if (patlen == 0)
7711         return;
7712     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7713         if (args) {
7714             const char * const s = va_arg(*args, char*);
7715             sv_catpv(sv, s ? s : nullstr);
7716         }
7717         else if (svix < svmax) {
7718             sv_catsv(sv, *svargs);
7719         }
7720         return;
7721     }
7722     if (args && patlen == 3 && pat[0] == '%' &&
7723                 pat[1] == '-' && pat[2] == 'p') {
7724         argsv = va_arg(*args, SV*);
7725         sv_catsv(sv, argsv);
7726         return;
7727     }
7728
7729 #ifndef USE_LONG_DOUBLE
7730     /* special-case "%.<number>[gf]" */
7731     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7732          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7733         unsigned digits = 0;
7734         const char *pp;
7735
7736         pp = pat + 2;
7737         while (*pp >= '0' && *pp <= '9')
7738             digits = 10 * digits + (*pp++ - '0');
7739         if (pp - pat == (int)patlen - 1) {
7740             NV nv;
7741
7742             if (svix < svmax)
7743                 nv = SvNV(*svargs);
7744             else
7745                 return;
7746             if (*pp == 'g') {
7747                 /* Add check for digits != 0 because it seems that some
7748                    gconverts are buggy in this case, and we don't yet have
7749                    a Configure test for this.  */
7750                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7751                      /* 0, point, slack */
7752                     Gconvert(nv, (int)digits, 0, ebuf);
7753                     sv_catpv(sv, ebuf);
7754                     if (*ebuf)  /* May return an empty string for digits==0 */
7755                         return;
7756                 }
7757             } else if (!digits) {
7758                 STRLEN l;
7759
7760                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7761                     sv_catpvn(sv, p, l);
7762                     return;
7763                 }
7764             }
7765         }
7766     }
7767 #endif /* !USE_LONG_DOUBLE */
7768
7769     if (!args && svix < svmax && DO_UTF8(*svargs))
7770         has_utf8 = TRUE;
7771
7772     patend = (char*)pat + patlen;
7773     for (p = (char*)pat; p < patend; p = q) {
7774         bool alt = FALSE;
7775         bool left = FALSE;
7776         bool vectorize = FALSE;
7777         bool vectorarg = FALSE;
7778         bool vec_utf8 = FALSE;
7779         char fill = ' ';
7780         char plus = 0;
7781         char intsize = 0;
7782         STRLEN width = 0;
7783         STRLEN zeros = 0;
7784         bool has_precis = FALSE;
7785         STRLEN precis = 0;
7786         I32 osvix = svix;
7787         bool is_utf8 = FALSE;  /* is this item utf8?   */
7788 #ifdef HAS_LDBL_SPRINTF_BUG
7789         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
7790            with sfio - Allen <allens@cpan.org> */
7791         bool fix_ldbl_sprintf_bug = FALSE;
7792 #endif
7793
7794         char esignbuf[4];
7795         U8 utf8buf[UTF8_MAXBYTES+1];
7796         STRLEN esignlen = 0;
7797
7798         const char *eptr = Nullch;
7799         STRLEN elen = 0;
7800         SV *vecsv = Nullsv;
7801         const U8 *vecstr = Null(U8*);
7802         STRLEN veclen = 0;
7803         char c = 0;
7804         int i;
7805         unsigned base = 0;
7806         IV iv = 0;
7807         UV uv = 0;
7808         /* we need a long double target in case HAS_LONG_DOUBLE but
7809            not USE_LONG_DOUBLE
7810         */
7811 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
7812         long double nv;
7813 #else
7814         NV nv;
7815 #endif
7816         STRLEN have;
7817         STRLEN need;
7818         STRLEN gap;
7819         const char *dotstr = ".";
7820         STRLEN dotstrlen = 1;
7821         I32 efix = 0; /* explicit format parameter index */
7822         I32 ewix = 0; /* explicit width index */
7823         I32 epix = 0; /* explicit precision index */
7824         I32 evix = 0; /* explicit vector index */
7825         bool asterisk = FALSE;
7826
7827         /* echo everything up to the next format specification */
7828         for (q = p; q < patend && *q != '%'; ++q) ;
7829         if (q > p) {
7830             if (has_utf8 && !pat_utf8)
7831                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
7832             else
7833                 sv_catpvn(sv, p, q - p);
7834             p = q;
7835         }
7836         if (q++ >= patend)
7837             break;
7838
7839 /*
7840     We allow format specification elements in this order:
7841         \d+\$              explicit format parameter index
7842         [-+ 0#]+           flags
7843         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
7844         0                  flag (as above): repeated to allow "v02"     
7845         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
7846         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
7847         [hlqLV]            size
7848     [%bcdefginopsuxDFOUX] format (mandatory)
7849 */
7850
7851         if (args) {
7852 /*  
7853         As of perl5.9.3, printf format checking is on by default.
7854         Internally, perl uses %p formats to provide an escape to
7855         some extended formatting.  This block deals with those
7856         extensions: if it does not match, (char*)q is reset and
7857         the normal format processing code is used.
7858
7859         Currently defined extensions are:
7860                 %p              include pointer address (standard)      
7861                 %-p     (SVf)   include an SV (previously %_)
7862                 %-<num>p        include an SV with precision <num>      
7863                 %1p     (VDf)   include a v-string (as %vd)
7864                 %<num>p         reserved for future extensions
7865
7866         Robin Barker 2005-07-14
7867 */
7868             char* r = q; 
7869             bool sv = FALSE;    
7870             STRLEN n = 0;
7871             if (*q == '-')
7872                 sv = *q++;
7873             EXPECT_NUMBER(q, n);
7874             if (*q++ == 'p') {
7875                 if (sv) {                       /* SVf */
7876                     if (n) {
7877                         precis = n;
7878                         has_precis = TRUE;
7879                     }
7880                     argsv = va_arg(*args, SV*);
7881                     eptr = SvPVx_const(argsv, elen);
7882                     if (DO_UTF8(argsv))
7883                         is_utf8 = TRUE;
7884                     goto string;
7885                 }
7886 #if vdNUMBER
7887                 else if (n == vdNUMBER) {       /* VDf */
7888                     vectorize = TRUE;
7889                     VECTORIZE_ARGS
7890                     goto format_vd;
7891                 }
7892 #endif
7893                 else if (n) {
7894                     if (ckWARN_d(WARN_INTERNAL))
7895                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
7896                         "internal %%<num>p might conflict with future printf extensions");
7897                 }
7898             }
7899             q = r; 
7900         }
7901
7902         if (EXPECT_NUMBER(q, width)) {
7903             if (*q == '$') {
7904                 ++q;
7905                 efix = width;
7906             } else {
7907                 goto gotwidth;
7908             }
7909         }
7910
7911         /* FLAGS */
7912
7913         while (*q) {
7914             switch (*q) {
7915             case ' ':
7916             case '+':
7917                 plus = *q++;
7918                 continue;
7919
7920             case '-':
7921                 left = TRUE;
7922                 q++;
7923                 continue;
7924
7925             case '0':
7926                 fill = *q++;
7927                 continue;
7928
7929             case '#':
7930                 alt = TRUE;
7931                 q++;
7932                 continue;
7933
7934             default:
7935                 break;
7936             }
7937             break;
7938         }
7939
7940       tryasterisk:
7941         if (*q == '*') {
7942             q++;
7943             if (EXPECT_NUMBER(q, ewix))
7944                 if (*q++ != '$')
7945                     goto unknown;
7946             asterisk = TRUE;
7947         }
7948         if (*q == 'v') {
7949             q++;
7950             if (vectorize)
7951                 goto unknown;
7952             if ((vectorarg = asterisk)) {
7953                 evix = ewix;
7954                 ewix = 0;
7955                 asterisk = FALSE;
7956             }
7957             vectorize = TRUE;
7958             goto tryasterisk;
7959         }
7960
7961         if (!asterisk)
7962         {
7963             if( *q == '0' )
7964                 fill = *q++;
7965             EXPECT_NUMBER(q, width);
7966         }
7967
7968         if (vectorize) {
7969             if (vectorarg) {
7970                 if (args)
7971                     vecsv = va_arg(*args, SV*);
7972                 else if (evix) {
7973                     vecsv = (evix > 0 && evix <= svmax)
7974                         ? svargs[evix-1] : &PL_sv_undef;
7975                 } else {
7976                     vecsv = svix < svmax ? svargs[svix++] : &PL_sv_undef;
7977                 }
7978                 dotstr = SvPV_const(vecsv, dotstrlen);
7979                 /* Keep the DO_UTF8 test *after* the SvPV call, else things go
7980                    bad with tied or overloaded values that return UTF8.  */
7981                 if (DO_UTF8(vecsv))
7982                     is_utf8 = TRUE;
7983                 else if (has_utf8) {
7984                     vecsv = sv_mortalcopy(vecsv);
7985                     sv_utf8_upgrade(vecsv);
7986                     dotstr = SvPV_const(vecsv, dotstrlen);
7987                     is_utf8 = TRUE;
7988                 }                   
7989             }
7990             if (args) {
7991                 VECTORIZE_ARGS
7992             }
7993             else if (efix ? (efix > 0 && efix <= svmax) : svix < svmax) {
7994                 vecsv = svargs[efix ? efix-1 : svix++];
7995                 vecstr = (U8*)SvPV_const(vecsv,veclen);
7996                 vec_utf8 = DO_UTF8(vecsv);
7997
7998                 /* if this is a version object, we need to convert
7999                  * back into v-string notation and then let the
8000                  * vectorize happen normally
8001                  */
8002                 if (sv_derived_from(vecsv, "version")) {
8003                     char *version = savesvpv(vecsv);
8004                     vecsv = sv_newmortal();
8005                     /* scan_vstring is expected to be called during
8006                      * tokenization, so we need to fake up the end
8007                      * of the buffer for it
8008                      */
8009                     PL_bufend = version + veclen;
8010                     scan_vstring(version, vecsv);
8011                     vecstr = (U8*)SvPV_const(vecsv, veclen);
8012                     vec_utf8 = DO_UTF8(vecsv);
8013                     Safefree(version);
8014                 }
8015             }
8016             else {
8017                 vecstr = (U8*)"";
8018                 veclen = 0;
8019             }
8020         }
8021
8022         if (asterisk) {
8023             if (args)
8024                 i = va_arg(*args, int);
8025             else
8026                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8027                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8028             left |= (i < 0);
8029             width = (i < 0) ? -i : i;
8030         }
8031       gotwidth:
8032
8033         /* PRECISION */
8034
8035         if (*q == '.') {
8036             q++;
8037             if (*q == '*') {
8038                 q++;
8039                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8040                     goto unknown;
8041                 /* XXX: todo, support specified precision parameter */
8042                 if (epix)
8043                     goto unknown;
8044                 if (args)
8045                     i = va_arg(*args, int);
8046                 else
8047                     i = (ewix ? ewix <= svmax : svix < svmax)
8048                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8049                 precis = (i < 0) ? 0 : i;
8050             }
8051             else {
8052                 precis = 0;
8053                 while (isDIGIT(*q))
8054                     precis = precis * 10 + (*q++ - '0');
8055             }
8056             has_precis = TRUE;
8057         }
8058
8059         /* SIZE */
8060
8061         switch (*q) {
8062 #ifdef WIN32
8063         case 'I':                       /* Ix, I32x, and I64x */
8064 #  ifdef WIN64
8065             if (q[1] == '6' && q[2] == '4') {
8066                 q += 3;
8067                 intsize = 'q';
8068                 break;
8069             }
8070 #  endif
8071             if (q[1] == '3' && q[2] == '2') {
8072                 q += 3;
8073                 break;
8074             }
8075 #  ifdef WIN64
8076             intsize = 'q';
8077 #  endif
8078             q++;
8079             break;
8080 #endif
8081 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8082         case 'L':                       /* Ld */
8083             /* FALL THROUGH */
8084 #ifdef HAS_QUAD
8085         case 'q':                       /* qd */
8086 #endif
8087             intsize = 'q';
8088             q++;
8089             break;
8090 #endif
8091         case 'l':
8092 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8093             if (*(q + 1) == 'l') {      /* lld, llf */
8094                 intsize = 'q';
8095                 q += 2;
8096                 break;
8097              }
8098 #endif
8099             /* FALL THROUGH */
8100         case 'h':
8101             /* FALL THROUGH */
8102         case 'V':
8103             intsize = *q++;
8104             break;
8105         }
8106
8107         /* CONVERSION */
8108
8109         if (*q == '%') {
8110             eptr = q++;
8111             elen = 1;
8112             if (vectorize) {
8113                 c = '%';
8114                 goto unknown;
8115             }
8116             goto string;
8117         }
8118
8119         if (!vectorize && !args) {
8120             if (efix) {
8121                 const I32 i = efix-1;
8122                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8123             } else {
8124                 argsv = (svix >= 0 && svix < svmax)
8125                     ? svargs[svix++] : &PL_sv_undef;
8126             }
8127         }
8128
8129         switch (c = *q++) {
8130
8131             /* STRINGS */
8132
8133         case 'c':
8134             if (vectorize)
8135                 goto unknown;
8136             uv = (args) ? va_arg(*args, int) : SvIVx(argsv);
8137             if ((uv > 255 ||
8138                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8139                 && !IN_BYTES) {
8140                 eptr = (char*)utf8buf;
8141                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8142                 is_utf8 = TRUE;
8143             }
8144             else {
8145                 c = (char)uv;
8146                 eptr = &c;
8147                 elen = 1;
8148             }
8149             goto string;
8150
8151         case 's':
8152             if (vectorize)
8153                 goto unknown;
8154             if (args) {
8155                 eptr = va_arg(*args, char*);
8156                 if (eptr)
8157 #ifdef MACOS_TRADITIONAL
8158                   /* On MacOS, %#s format is used for Pascal strings */
8159                   if (alt)
8160                     elen = *eptr++;
8161                   else
8162 #endif
8163                     elen = strlen(eptr);
8164                 else {
8165                     eptr = (char *)nullstr;
8166                     elen = sizeof nullstr - 1;
8167                 }
8168             }
8169             else {
8170                 eptr = SvPVx_const(argsv, elen);
8171                 if (DO_UTF8(argsv)) {
8172                     if (has_precis && precis < elen) {
8173                         I32 p = precis;
8174                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8175                         precis = p;
8176                     }
8177                     if (width) { /* fudge width (can't fudge elen) */
8178                         width += elen - sv_len_utf8(argsv);
8179                     }
8180                     is_utf8 = TRUE;
8181                 }
8182             }
8183
8184         string:
8185             if (has_precis && elen > precis)
8186                 elen = precis;
8187             break;
8188
8189             /* INTEGERS */
8190
8191         case 'p':
8192             if (alt || vectorize)
8193                 goto unknown;
8194             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8195             base = 16;
8196             goto integer;
8197
8198         case 'D':
8199 #ifdef IV_IS_QUAD
8200             intsize = 'q';
8201 #else
8202             intsize = 'l';
8203 #endif
8204             /* FALL THROUGH */
8205         case 'd':
8206         case 'i':
8207 #if vdNUMBER
8208         format_vd:
8209 #endif
8210             if (vectorize) {
8211                 STRLEN ulen;
8212                 if (!veclen)
8213                     continue;
8214                 if (vec_utf8)
8215                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8216                                         UTF8_ALLOW_ANYUV);
8217                 else {
8218                     uv = *vecstr;
8219                     ulen = 1;
8220                 }
8221                 vecstr += ulen;
8222                 veclen -= ulen;
8223                 if (plus)
8224                      esignbuf[esignlen++] = plus;
8225             }
8226             else if (args) {
8227                 switch (intsize) {
8228                 case 'h':       iv = (short)va_arg(*args, int); break;
8229                 case 'l':       iv = va_arg(*args, long); break;
8230                 case 'V':       iv = va_arg(*args, IV); break;
8231                 default:        iv = va_arg(*args, int); break;
8232 #ifdef HAS_QUAD
8233                 case 'q':       iv = va_arg(*args, Quad_t); break;
8234 #endif
8235                 }
8236             }
8237             else {
8238                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8239                 switch (intsize) {
8240                 case 'h':       iv = (short)tiv; break;
8241                 case 'l':       iv = (long)tiv; break;
8242                 case 'V':
8243                 default:        iv = tiv; break;
8244 #ifdef HAS_QUAD
8245                 case 'q':       iv = (Quad_t)tiv; break;
8246 #endif
8247                 }
8248             }
8249             if ( !vectorize )   /* we already set uv above */
8250             {
8251                 if (iv >= 0) {
8252                     uv = iv;
8253                     if (plus)
8254                         esignbuf[esignlen++] = plus;
8255                 }
8256                 else {
8257                     uv = -iv;
8258                     esignbuf[esignlen++] = '-';
8259                 }
8260             }
8261             base = 10;
8262             goto integer;
8263
8264         case 'U':
8265 #ifdef IV_IS_QUAD
8266             intsize = 'q';
8267 #else
8268             intsize = 'l';
8269 #endif
8270             /* FALL THROUGH */
8271         case 'u':
8272             base = 10;
8273             goto uns_integer;
8274
8275         case 'b':
8276             base = 2;
8277             goto uns_integer;
8278
8279         case 'O':
8280 #ifdef IV_IS_QUAD
8281             intsize = 'q';
8282 #else
8283             intsize = 'l';
8284 #endif
8285             /* FALL THROUGH */
8286         case 'o':
8287             base = 8;
8288             goto uns_integer;
8289
8290         case 'X':
8291         case 'x':
8292             base = 16;
8293
8294         uns_integer:
8295             if (vectorize) {
8296                 STRLEN ulen;
8297         vector:
8298                 if (!veclen)
8299                     continue;
8300                 if (vec_utf8)
8301                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8302                                         UTF8_ALLOW_ANYUV);
8303                 else {
8304                     uv = *vecstr;
8305                     ulen = 1;
8306                 }
8307                 vecstr += ulen;
8308                 veclen -= ulen;
8309             }
8310             else if (args) {
8311                 switch (intsize) {
8312                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8313                 case 'l':  uv = va_arg(*args, unsigned long); break;
8314                 case 'V':  uv = va_arg(*args, UV); break;
8315                 default:   uv = va_arg(*args, unsigned); break;
8316 #ifdef HAS_QUAD
8317                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8318 #endif
8319                 }
8320             }
8321             else {
8322                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8323                 switch (intsize) {
8324                 case 'h':       uv = (unsigned short)tuv; break;
8325                 case 'l':       uv = (unsigned long)tuv; break;
8326                 case 'V':
8327                 default:        uv = tuv; break;
8328 #ifdef HAS_QUAD
8329                 case 'q':       uv = (Uquad_t)tuv; break;
8330 #endif
8331                 }
8332             }
8333
8334         integer:
8335             {
8336                 char *ptr = ebuf + sizeof ebuf;
8337                 switch (base) {
8338                     unsigned dig;
8339                 case 16:
8340                     if (!uv)
8341                         alt = FALSE;
8342                     p = (char*)((c == 'X')
8343                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8344                     do {
8345                         dig = uv & 15;
8346                         *--ptr = p[dig];
8347                     } while (uv >>= 4);
8348                     if (alt) {
8349                         esignbuf[esignlen++] = '0';
8350                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8351                     }
8352                     break;
8353                 case 8:
8354                     do {
8355                         dig = uv & 7;
8356                         *--ptr = '0' + dig;
8357                     } while (uv >>= 3);
8358                     if (alt && *ptr != '0')
8359                         *--ptr = '0';
8360                     break;
8361                 case 2:
8362                     if (!uv)
8363                         alt = FALSE;
8364                     do {
8365                         dig = uv & 1;
8366                         *--ptr = '0' + dig;
8367                     } while (uv >>= 1);
8368                     if (alt) {
8369                         esignbuf[esignlen++] = '0';
8370                         esignbuf[esignlen++] = 'b';
8371                     }
8372                     break;
8373                 default:                /* it had better be ten or less */
8374                     do {
8375                         dig = uv % base;
8376                         *--ptr = '0' + dig;
8377                     } while (uv /= base);
8378                     break;
8379                 }
8380                 elen = (ebuf + sizeof ebuf) - ptr;
8381                 eptr = ptr;
8382                 if (has_precis) {
8383                     if (precis > elen)
8384                         zeros = precis - elen;
8385                     else if (precis == 0 && elen == 1 && *eptr == '0')
8386                         elen = 0;
8387                 }
8388             }
8389             break;
8390
8391             /* FLOATING POINT */
8392
8393         case 'F':
8394             c = 'f';            /* maybe %F isn't supported here */
8395             /* FALL THROUGH */
8396         case 'e': case 'E':
8397         case 'f':
8398         case 'g': case 'G':
8399             if (vectorize)
8400                 goto unknown;
8401
8402             /* This is evil, but floating point is even more evil */
8403
8404             /* for SV-style calling, we can only get NV
8405                for C-style calling, we assume %f is double;
8406                for simplicity we allow any of %Lf, %llf, %qf for long double
8407             */
8408             switch (intsize) {
8409             case 'V':
8410 #if defined(USE_LONG_DOUBLE)
8411                 intsize = 'q';
8412 #endif
8413                 break;
8414 /* [perl #20339] - we should accept and ignore %lf rather than die */
8415             case 'l':
8416                 /* FALL THROUGH */
8417             default:
8418 #if defined(USE_LONG_DOUBLE)
8419                 intsize = args ? 0 : 'q';
8420 #endif
8421                 break;
8422             case 'q':
8423 #if defined(HAS_LONG_DOUBLE)
8424                 break;
8425 #else
8426                 /* FALL THROUGH */
8427 #endif
8428             case 'h':
8429                 goto unknown;
8430             }
8431
8432             /* now we need (long double) if intsize == 'q', else (double) */
8433             nv = (args) ?
8434 #if LONG_DOUBLESIZE > DOUBLESIZE
8435                 intsize == 'q' ?
8436                     va_arg(*args, long double) :
8437                     va_arg(*args, double)
8438 #else
8439                     va_arg(*args, double)
8440 #endif
8441                 : SvNVx(argsv);
8442
8443             need = 0;
8444             if (c != 'e' && c != 'E') {
8445                 i = PERL_INT_MIN;
8446                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8447                    will cast our (long double) to (double) */
8448                 (void)Perl_frexp(nv, &i);
8449                 if (i == PERL_INT_MIN)
8450                     Perl_die(aTHX_ "panic: frexp");
8451                 if (i > 0)
8452                     need = BIT_DIGITS(i);
8453             }
8454             need += has_precis ? precis : 6; /* known default */
8455
8456             if (need < width)
8457                 need = width;
8458
8459 #ifdef HAS_LDBL_SPRINTF_BUG
8460             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8461                with sfio - Allen <allens@cpan.org> */
8462
8463 #  ifdef DBL_MAX
8464 #    define MY_DBL_MAX DBL_MAX
8465 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8466 #    if DOUBLESIZE >= 8
8467 #      define MY_DBL_MAX 1.7976931348623157E+308L
8468 #    else
8469 #      define MY_DBL_MAX 3.40282347E+38L
8470 #    endif
8471 #  endif
8472
8473 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8474 #    define MY_DBL_MAX_BUG 1L
8475 #  else
8476 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8477 #  endif
8478
8479 #  ifdef DBL_MIN
8480 #    define MY_DBL_MIN DBL_MIN
8481 #  else  /* XXX guessing! -Allen */
8482 #    if DOUBLESIZE >= 8
8483 #      define MY_DBL_MIN 2.2250738585072014E-308L
8484 #    else
8485 #      define MY_DBL_MIN 1.17549435E-38L
8486 #    endif
8487 #  endif
8488
8489             if ((intsize == 'q') && (c == 'f') &&
8490                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8491                 (need < DBL_DIG)) {
8492                 /* it's going to be short enough that
8493                  * long double precision is not needed */
8494
8495                 if ((nv <= 0L) && (nv >= -0L))
8496                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8497                 else {
8498                     /* would use Perl_fp_class as a double-check but not
8499                      * functional on IRIX - see perl.h comments */
8500
8501                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8502                         /* It's within the range that a double can represent */
8503 #if defined(DBL_MAX) && !defined(DBL_MIN)
8504                         if ((nv >= ((long double)1/DBL_MAX)) ||
8505                             (nv <= (-(long double)1/DBL_MAX)))
8506 #endif
8507                         fix_ldbl_sprintf_bug = TRUE;
8508                     }
8509                 }
8510                 if (fix_ldbl_sprintf_bug == TRUE) {
8511                     double temp;
8512
8513                     intsize = 0;
8514                     temp = (double)nv;
8515                     nv = (NV)temp;
8516                 }
8517             }
8518
8519 #  undef MY_DBL_MAX
8520 #  undef MY_DBL_MAX_BUG
8521 #  undef MY_DBL_MIN
8522
8523 #endif /* HAS_LDBL_SPRINTF_BUG */
8524
8525             need += 20; /* fudge factor */
8526             if (PL_efloatsize < need) {
8527                 Safefree(PL_efloatbuf);
8528                 PL_efloatsize = need + 20; /* more fudge */
8529                 Newx(PL_efloatbuf, PL_efloatsize, char);
8530                 PL_efloatbuf[0] = '\0';
8531             }
8532
8533             if ( !(width || left || plus || alt) && fill != '0'
8534                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8535                 /* See earlier comment about buggy Gconvert when digits,
8536                    aka precis is 0  */
8537                 if ( c == 'g' && precis) {
8538                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8539                     /* May return an empty string for digits==0 */
8540                     if (*PL_efloatbuf) {
8541                         elen = strlen(PL_efloatbuf);
8542                         goto float_converted;
8543                     }
8544                 } else if ( c == 'f' && !precis) {
8545                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8546                         break;
8547                 }
8548             }
8549             {
8550                 char *ptr = ebuf + sizeof ebuf;
8551                 *--ptr = '\0';
8552                 *--ptr = c;
8553                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8554 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8555                 if (intsize == 'q') {
8556                     /* Copy the one or more characters in a long double
8557                      * format before the 'base' ([efgEFG]) character to
8558                      * the format string. */
8559                     static char const prifldbl[] = PERL_PRIfldbl;
8560                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8561                     while (p >= prifldbl) { *--ptr = *p--; }
8562                 }
8563 #endif
8564                 if (has_precis) {
8565                     base = precis;
8566                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8567                     *--ptr = '.';
8568                 }
8569                 if (width) {
8570                     base = width;
8571                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8572                 }
8573                 if (fill == '0')
8574                     *--ptr = fill;
8575                 if (left)
8576                     *--ptr = '-';
8577                 if (plus)
8578                     *--ptr = plus;
8579                 if (alt)
8580                     *--ptr = '#';
8581                 *--ptr = '%';
8582
8583                 /* No taint.  Otherwise we are in the strange situation
8584                  * where printf() taints but print($float) doesn't.
8585                  * --jhi */
8586 #if defined(HAS_LONG_DOUBLE)
8587                 elen = ((intsize == 'q')
8588                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8589                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8590 #else
8591                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8592 #endif
8593             }
8594         float_converted:
8595             eptr = PL_efloatbuf;
8596             break;
8597
8598             /* SPECIAL */
8599
8600         case 'n':
8601             if (vectorize)
8602                 goto unknown;
8603             i = SvCUR(sv) - origlen;
8604             if (args) {
8605                 switch (intsize) {
8606                 case 'h':       *(va_arg(*args, short*)) = i; break;
8607                 default:        *(va_arg(*args, int*)) = i; break;
8608                 case 'l':       *(va_arg(*args, long*)) = i; break;
8609                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8610 #ifdef HAS_QUAD
8611                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8612 #endif
8613                 }
8614             }
8615             else
8616                 sv_setuv_mg(argsv, (UV)i);
8617             continue;   /* not "break" */
8618
8619             /* UNKNOWN */
8620
8621         default:
8622       unknown:
8623             if (!args
8624                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8625                 && ckWARN(WARN_PRINTF))
8626             {
8627                 SV * const msg = sv_newmortal();
8628                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8629                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8630                 if (c) {
8631                     if (isPRINT(c))
8632                         Perl_sv_catpvf(aTHX_ msg,
8633                                        "\"%%%c\"", c & 0xFF);
8634                     else
8635                         Perl_sv_catpvf(aTHX_ msg,
8636                                        "\"%%\\%03"UVof"\"",
8637                                        (UV)c & 0xFF);
8638                 } else
8639                     sv_catpv(msg, "end of string");
8640                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8641             }
8642
8643             /* output mangled stuff ... */
8644             if (c == '\0')
8645                 --q;
8646             eptr = p;
8647             elen = q - p;
8648
8649             /* ... right here, because formatting flags should not apply */
8650             SvGROW(sv, SvCUR(sv) + elen + 1);
8651             p = SvEND(sv);
8652             Copy(eptr, p, elen, char);
8653             p += elen;
8654             *p = '\0';
8655             SvCUR_set(sv, p - SvPVX_const(sv));
8656             svix = osvix;
8657             continue;   /* not "break" */
8658         }
8659
8660         /* calculate width before utf8_upgrade changes it */
8661         have = esignlen + zeros + elen;
8662         if (have < zeros)
8663             Perl_croak_nocontext(PL_memory_wrap);
8664
8665         if (is_utf8 != has_utf8) {
8666              if (is_utf8) {
8667                   if (SvCUR(sv))
8668                        sv_utf8_upgrade(sv);
8669              }
8670              else {
8671                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8672                   sv_utf8_upgrade(nsv);
8673                   eptr = SvPVX_const(nsv);
8674                   elen = SvCUR(nsv);
8675              }
8676              SvGROW(sv, SvCUR(sv) + elen + 1);
8677              p = SvEND(sv);
8678              *p = '\0';
8679         }
8680
8681         need = (have > width ? have : width);
8682         gap = need - have;
8683
8684         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8685             Perl_croak_nocontext(PL_memory_wrap);
8686         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8687         p = SvEND(sv);
8688         if (esignlen && fill == '0') {
8689             int i;
8690             for (i = 0; i < (int)esignlen; i++)
8691                 *p++ = esignbuf[i];
8692         }
8693         if (gap && !left) {
8694             memset(p, fill, gap);
8695             p += gap;
8696         }
8697         if (esignlen && fill != '0') {
8698             int i;
8699             for (i = 0; i < (int)esignlen; i++)
8700                 *p++ = esignbuf[i];
8701         }
8702         if (zeros) {
8703             int i;
8704             for (i = zeros; i; i--)
8705                 *p++ = '0';
8706         }
8707         if (elen) {
8708             Copy(eptr, p, elen, char);
8709             p += elen;
8710         }
8711         if (gap && left) {
8712             memset(p, ' ', gap);
8713             p += gap;
8714         }
8715         if (vectorize) {
8716             if (veclen) {
8717                 Copy(dotstr, p, dotstrlen, char);
8718                 p += dotstrlen;
8719             }
8720             else
8721                 vectorize = FALSE;              /* done iterating over vecstr */
8722         }
8723         if (is_utf8)
8724             has_utf8 = TRUE;
8725         if (has_utf8)
8726             SvUTF8_on(sv);
8727         *p = '\0';
8728         SvCUR_set(sv, p - SvPVX_const(sv));
8729         if (vectorize) {
8730             esignlen = 0;
8731             goto vector;
8732         }
8733     }
8734 }
8735
8736 /* =========================================================================
8737
8738 =head1 Cloning an interpreter
8739
8740 All the macros and functions in this section are for the private use of
8741 the main function, perl_clone().
8742
8743 The foo_dup() functions make an exact copy of an existing foo thinngy.
8744 During the course of a cloning, a hash table is used to map old addresses
8745 to new addresses. The table is created and manipulated with the
8746 ptr_table_* functions.
8747
8748 =cut
8749
8750 ============================================================================*/
8751
8752
8753 #if defined(USE_ITHREADS)
8754
8755 #ifndef GpREFCNT_inc
8756 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8757 #endif
8758
8759
8760 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8761 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8762 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8763 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8764 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8765 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8766 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8767 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8768 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8769 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8770 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8771 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8772 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8773
8774
8775 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8776    regcomp.c. AMS 20010712 */
8777
8778 REGEXP *
8779 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8780 {
8781     dVAR;
8782     REGEXP *ret;
8783     int i, len, npar;
8784     struct reg_substr_datum *s;
8785
8786     if (!r)
8787         return (REGEXP *)NULL;
8788
8789     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8790         return ret;
8791
8792     len = r->offsets[0];
8793     npar = r->nparens+1;
8794
8795     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8796     Copy(r->program, ret->program, len+1, regnode);
8797
8798     Newx(ret->startp, npar, I32);
8799     Copy(r->startp, ret->startp, npar, I32);
8800     Newx(ret->endp, npar, I32);
8801     Copy(r->startp, ret->startp, npar, I32);
8802
8803     Newx(ret->substrs, 1, struct reg_substr_data);
8804     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
8805         s->min_offset = r->substrs->data[i].min_offset;
8806         s->max_offset = r->substrs->data[i].max_offset;
8807         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
8808         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
8809     }
8810
8811     ret->regstclass = NULL;
8812     if (r->data) {
8813         struct reg_data *d;
8814         const int count = r->data->count;
8815         int i;
8816
8817         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
8818                 char, struct reg_data);
8819         Newx(d->what, count, U8);
8820
8821         d->count = count;
8822         for (i = 0; i < count; i++) {
8823             d->what[i] = r->data->what[i];
8824             switch (d->what[i]) {
8825                 /* legal options are one of: sfpont
8826                    see also regcomp.h and pregfree() */
8827             case 's':
8828                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
8829                 break;
8830             case 'p':
8831                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
8832                 break;
8833             case 'f':
8834                 /* This is cheating. */
8835                 Newx(d->data[i], 1, struct regnode_charclass_class);
8836                 StructCopy(r->data->data[i], d->data[i],
8837                             struct regnode_charclass_class);
8838                 ret->regstclass = (regnode*)d->data[i];
8839                 break;
8840             case 'o':
8841                 /* Compiled op trees are readonly, and can thus be
8842                    shared without duplication. */
8843                 OP_REFCNT_LOCK;
8844                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
8845                 OP_REFCNT_UNLOCK;
8846                 break;
8847             case 'n':
8848                 d->data[i] = r->data->data[i];
8849                 break;
8850             case 't':
8851                 d->data[i] = r->data->data[i];
8852                 OP_REFCNT_LOCK;
8853                 ((reg_trie_data*)d->data[i])->refcount++;
8854                 OP_REFCNT_UNLOCK;
8855                 break;
8856             default:
8857                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
8858             }
8859         }
8860
8861         ret->data = d;
8862     }
8863     else
8864         ret->data = NULL;
8865
8866     Newx(ret->offsets, 2*len+1, U32);
8867     Copy(r->offsets, ret->offsets, 2*len+1, U32);
8868
8869     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
8870     ret->refcnt         = r->refcnt;
8871     ret->minlen         = r->minlen;
8872     ret->prelen         = r->prelen;
8873     ret->nparens        = r->nparens;
8874     ret->lastparen      = r->lastparen;
8875     ret->lastcloseparen = r->lastcloseparen;
8876     ret->reganch        = r->reganch;
8877
8878     ret->sublen         = r->sublen;
8879
8880     if (RX_MATCH_COPIED(ret))
8881         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
8882     else
8883         ret->subbeg = Nullch;
8884 #ifdef PERL_OLD_COPY_ON_WRITE
8885     ret->saved_copy = Nullsv;
8886 #endif
8887
8888     ptr_table_store(PL_ptr_table, r, ret);
8889     return ret;
8890 }
8891
8892 /* duplicate a file handle */
8893
8894 PerlIO *
8895 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
8896 {
8897     PerlIO *ret;
8898
8899     PERL_UNUSED_ARG(type);
8900
8901     if (!fp)
8902         return (PerlIO*)NULL;
8903
8904     /* look for it in the table first */
8905     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
8906     if (ret)
8907         return ret;
8908
8909     /* create anew and remember what it is */
8910     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
8911     ptr_table_store(PL_ptr_table, fp, ret);
8912     return ret;
8913 }
8914
8915 /* duplicate a directory handle */
8916
8917 DIR *
8918 Perl_dirp_dup(pTHX_ DIR *dp)
8919 {
8920     if (!dp)
8921         return (DIR*)NULL;
8922     /* XXX TODO */
8923     return dp;
8924 }
8925
8926 /* duplicate a typeglob */
8927
8928 GP *
8929 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
8930 {
8931     GP *ret;
8932     if (!gp)
8933         return (GP*)NULL;
8934     /* look for it in the table first */
8935     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
8936     if (ret)
8937         return ret;
8938
8939     /* create anew and remember what it is */
8940     Newxz(ret, 1, GP);
8941     ptr_table_store(PL_ptr_table, gp, ret);
8942
8943     /* clone */
8944     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
8945     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
8946     ret->gp_io          = io_dup_inc(gp->gp_io, param);
8947     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
8948     ret->gp_av          = av_dup_inc(gp->gp_av, param);
8949     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
8950     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
8951     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
8952     ret->gp_cvgen       = gp->gp_cvgen;
8953     ret->gp_line        = gp->gp_line;
8954     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
8955     return ret;
8956 }
8957
8958 /* duplicate a chain of magic */
8959
8960 MAGIC *
8961 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
8962 {
8963     MAGIC *mgprev = (MAGIC*)NULL;
8964     MAGIC *mgret;
8965     if (!mg)
8966         return (MAGIC*)NULL;
8967     /* look for it in the table first */
8968     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
8969     if (mgret)
8970         return mgret;
8971
8972     for (; mg; mg = mg->mg_moremagic) {
8973         MAGIC *nmg;
8974         Newxz(nmg, 1, MAGIC);
8975         if (mgprev)
8976             mgprev->mg_moremagic = nmg;
8977         else
8978             mgret = nmg;
8979         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
8980         nmg->mg_private = mg->mg_private;
8981         nmg->mg_type    = mg->mg_type;
8982         nmg->mg_flags   = mg->mg_flags;
8983         if (mg->mg_type == PERL_MAGIC_qr) {
8984             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
8985         }
8986         else if(mg->mg_type == PERL_MAGIC_backref) {
8987             const AV * const av = (AV*) mg->mg_obj;
8988             SV **svp;
8989             I32 i;
8990             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
8991             svp = AvARRAY(av);
8992             for (i = AvFILLp(av); i >= 0; i--) {
8993                 if (!svp[i]) continue;
8994                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
8995             }
8996         }
8997         else if (mg->mg_type == PERL_MAGIC_symtab) {
8998             nmg->mg_obj = mg->mg_obj;
8999         }
9000         else {
9001             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9002                               ? sv_dup_inc(mg->mg_obj, param)
9003                               : sv_dup(mg->mg_obj, param);
9004         }
9005         nmg->mg_len     = mg->mg_len;
9006         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9007         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9008             if (mg->mg_len > 0) {
9009                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9010                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9011                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9012                 {
9013                     AMT * const amtp = (AMT*)mg->mg_ptr;
9014                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9015                     I32 i;
9016                     for (i = 1; i < NofAMmeth; i++) {
9017                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9018                     }
9019                 }
9020             }
9021             else if (mg->mg_len == HEf_SVKEY)
9022                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9023         }
9024         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9025             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9026         }
9027         mgprev = nmg;
9028     }
9029     return mgret;
9030 }
9031
9032 /* create a new pointer-mapping table */
9033
9034 PTR_TBL_t *
9035 Perl_ptr_table_new(pTHX)
9036 {
9037     PTR_TBL_t *tbl;
9038     Newxz(tbl, 1, PTR_TBL_t);
9039     tbl->tbl_max        = 511;
9040     tbl->tbl_items      = 0;
9041     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9042     return tbl;
9043 }
9044
9045 #define PTR_TABLE_HASH(ptr) \
9046   ((PTR2UV(ptr) >> 3) ^ (PTR2UV(ptr) >> (3 + 7)) ^ (PTR2UV(ptr) >> (3 + 17)))
9047
9048 /* 
9049    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9050    following define) and at call to new_body_inline made below in 
9051    Perl_ptr_table_store()
9052  */
9053
9054 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9055
9056 /* map an existing pointer using a table */
9057
9058 STATIC PTR_TBL_ENT_t *
9059 S_ptr_table_find(pTHX_ PTR_TBL_t *tbl, const void *sv) {
9060     PTR_TBL_ENT_t *tblent;
9061     const UV hash = PTR_TABLE_HASH(sv);
9062     assert(tbl);
9063     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9064     for (; tblent; tblent = tblent->next) {
9065         if (tblent->oldval == sv)
9066             return tblent;
9067     }
9068     return 0;
9069 }
9070
9071 void *
9072 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9073 {
9074     PTR_TBL_ENT_t const *const tblent = S_ptr_table_find(aTHX_ tbl, sv);
9075     return tblent ? tblent->newval : (void *) 0;
9076 }
9077
9078 /* add a new entry to a pointer-mapping table */
9079
9080 void
9081 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9082 {
9083     PTR_TBL_ENT_t *tblent = S_ptr_table_find(aTHX_ tbl, oldsv);
9084
9085     if (tblent) {
9086         tblent->newval = newsv;
9087     } else {
9088         const UV entry = PTR_TABLE_HASH(oldsv) & tbl->tbl_max;
9089
9090         new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9091         tblent->oldval = oldsv;
9092         tblent->newval = newsv;
9093         tblent->next = tbl->tbl_ary[entry];
9094         tbl->tbl_ary[entry] = tblent;
9095         tbl->tbl_items++;
9096         if (tblent->next && tbl->tbl_items > tbl->tbl_max)
9097             ptr_table_split(tbl);
9098     }
9099 }
9100
9101 /* double the hash bucket size of an existing ptr table */
9102
9103 void
9104 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9105 {
9106     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9107     const UV oldsize = tbl->tbl_max + 1;
9108     UV newsize = oldsize * 2;
9109     UV i;
9110
9111     Renew(ary, newsize, PTR_TBL_ENT_t*);
9112     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9113     tbl->tbl_max = --newsize;
9114     tbl->tbl_ary = ary;
9115     for (i=0; i < oldsize; i++, ary++) {
9116         PTR_TBL_ENT_t **curentp, **entp, *ent;
9117         if (!*ary)
9118             continue;
9119         curentp = ary + oldsize;
9120         for (entp = ary, ent = *ary; ent; ent = *entp) {
9121             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9122                 *entp = ent->next;
9123                 ent->next = *curentp;
9124                 *curentp = ent;
9125                 continue;
9126             }
9127             else
9128                 entp = &ent->next;
9129         }
9130     }
9131 }
9132
9133 /* remove all the entries from a ptr table */
9134
9135 void
9136 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9137 {
9138     if (tbl && tbl->tbl_items) {
9139         register PTR_TBL_ENT_t **array = tbl->tbl_ary;
9140         UV riter = tbl->tbl_max;
9141
9142         do {
9143             PTR_TBL_ENT_t *entry = array[riter];
9144
9145             while (entry) {
9146                 PTR_TBL_ENT_t * const oentry = entry;
9147                 entry = entry->next;
9148                 del_pte(oentry);
9149             }
9150         } while (riter--);
9151
9152         tbl->tbl_items = 0;
9153     }
9154 }
9155
9156 /* clear and free a ptr table */
9157
9158 void
9159 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9160 {
9161     if (!tbl) {
9162         return;
9163     }
9164     ptr_table_clear(tbl);
9165     Safefree(tbl->tbl_ary);
9166     Safefree(tbl);
9167 }
9168
9169
9170 void
9171 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9172 {
9173     if (SvROK(sstr)) {
9174         SvRV_set(dstr, SvWEAKREF(sstr)
9175                        ? sv_dup(SvRV(sstr), param)
9176                        : sv_dup_inc(SvRV(sstr), param));
9177
9178     }
9179     else if (SvPVX_const(sstr)) {
9180         /* Has something there */
9181         if (SvLEN(sstr)) {
9182             /* Normal PV - clone whole allocated space */
9183             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9184             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9185                 /* Not that normal - actually sstr is copy on write.
9186                    But we are a true, independant SV, so:  */
9187                 SvREADONLY_off(dstr);
9188                 SvFAKE_off(dstr);
9189             }
9190         }
9191         else {
9192             /* Special case - not normally malloced for some reason */
9193             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9194                 /* A "shared" PV - clone it as "shared" PV */
9195                 SvPV_set(dstr,
9196                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9197                                          param)));
9198             }
9199             else {
9200                 /* Some other special case - random pointer */
9201                 SvPV_set(dstr, SvPVX(sstr));            
9202             }
9203         }
9204     }
9205     else {
9206         /* Copy the Null */
9207         if (SvTYPE(dstr) == SVt_RV)
9208             SvRV_set(dstr, NULL);
9209         else
9210             SvPV_set(dstr, 0);
9211     }
9212 }
9213
9214 /* duplicate an SV of any type (including AV, HV etc) */
9215
9216 SV *
9217 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9218 {
9219     dVAR;
9220     SV *dstr;
9221
9222     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9223         return Nullsv;
9224     /* look for it in the table first */
9225     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9226     if (dstr)
9227         return dstr;
9228
9229     if(param->flags & CLONEf_JOIN_IN) {
9230         /** We are joining here so we don't want do clone
9231             something that is bad **/
9232         const char *hvname;
9233
9234         if(SvTYPE(sstr) == SVt_PVHV &&
9235            (hvname = HvNAME_get(sstr))) {
9236             /** don't clone stashes if they already exist **/
9237             return (SV*)gv_stashpv(hvname,0);
9238         }
9239     }
9240
9241     /* create anew and remember what it is */
9242     new_SV(dstr);
9243
9244 #ifdef DEBUG_LEAKING_SCALARS
9245     dstr->sv_debug_optype = sstr->sv_debug_optype;
9246     dstr->sv_debug_line = sstr->sv_debug_line;
9247     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9248     dstr->sv_debug_cloned = 1;
9249 #  ifdef NETWARE
9250     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9251 #  else
9252     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9253 #  endif
9254 #endif
9255
9256     ptr_table_store(PL_ptr_table, sstr, dstr);
9257
9258     /* clone */
9259     SvFLAGS(dstr)       = SvFLAGS(sstr);
9260     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9261     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9262
9263 #ifdef DEBUGGING
9264     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9265         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9266                       PL_watch_pvx, SvPVX_const(sstr));
9267 #endif
9268
9269     /* don't clone objects whose class has asked us not to */
9270     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9271         SvFLAGS(dstr) &= ~SVTYPEMASK;
9272         SvOBJECT_off(dstr);
9273         return dstr;
9274     }
9275
9276     switch (SvTYPE(sstr)) {
9277     case SVt_NULL:
9278         SvANY(dstr)     = NULL;
9279         break;
9280     case SVt_IV:
9281         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9282         SvIV_set(dstr, SvIVX(sstr));
9283         break;
9284     case SVt_NV:
9285         SvANY(dstr)     = new_XNV();
9286         SvNV_set(dstr, SvNVX(sstr));
9287         break;
9288     case SVt_RV:
9289         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9290         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9291         break;
9292     default:
9293         {
9294             /* These are all the types that need complex bodies allocating.  */
9295             void *new_body;
9296             const svtype sv_type = SvTYPE(sstr);
9297             const struct body_details *const sv_type_details
9298                 = bodies_by_type + sv_type;
9299
9300             switch (sv_type) {
9301             default:
9302                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9303                            (IV)SvTYPE(sstr));
9304                 break;
9305
9306             case SVt_PVGV:
9307                 if (GvUNIQUE((GV*)sstr)) {
9308                     /* Do sharing here, and fall through */
9309                 }
9310             case SVt_PVIO:
9311             case SVt_PVFM:
9312             case SVt_PVHV:
9313             case SVt_PVAV:
9314             case SVt_PVBM:
9315             case SVt_PVCV:
9316             case SVt_PVLV:
9317             case SVt_PVMG:
9318             case SVt_PVNV:
9319             case SVt_PVIV:
9320             case SVt_PV:
9321                 assert(sv_type_details->size);
9322                 if (sv_type_details->arena) {
9323                     new_body_inline(new_body, sv_type_details->size, sv_type);
9324                     new_body
9325                         = (void*)((char*)new_body - sv_type_details->offset);
9326                 } else {
9327                     new_body = new_NOARENA(sv_type_details);
9328                 }
9329             }
9330             assert(new_body);
9331             SvANY(dstr) = new_body;
9332
9333 #ifndef PURIFY
9334             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9335                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9336                  sv_type_details->copy, char);
9337 #else
9338             Copy(((char*)SvANY(sstr)),
9339                  ((char*)SvANY(dstr)),
9340                  sv_type_details->size + sv_type_details->offset, char);
9341 #endif
9342
9343             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9344                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9345
9346             /* The Copy above means that all the source (unduplicated) pointers
9347                are now in the destination.  We can check the flags and the
9348                pointers in either, but it's possible that there's less cache
9349                missing by always going for the destination.
9350                FIXME - instrument and check that assumption  */
9351             if (sv_type >= SVt_PVMG) {
9352                 if (SvMAGIC(dstr))
9353                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9354                 if (SvSTASH(dstr))
9355                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9356             }
9357
9358             /* The cast silences a GCC warning about unhandled types.  */
9359             switch ((int)sv_type) {
9360             case SVt_PV:
9361                 break;
9362             case SVt_PVIV:
9363                 break;
9364             case SVt_PVNV:
9365                 break;
9366             case SVt_PVMG:
9367                 break;
9368             case SVt_PVBM:
9369                 break;
9370             case SVt_PVLV:
9371                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9372                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9373                     LvTARG(dstr) = dstr;
9374                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9375                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9376                 else
9377                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9378                 break;
9379             case SVt_PVGV:
9380                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9381                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9382                 /* Don't call sv_add_backref here as it's going to be created
9383                    as part of the magic cloning of the symbol table.  */
9384                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9385                 (void)GpREFCNT_inc(GvGP(dstr));
9386                 break;
9387             case SVt_PVIO:
9388                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9389                 if (IoOFP(dstr) == IoIFP(sstr))
9390                     IoOFP(dstr) = IoIFP(dstr);
9391                 else
9392                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9393                 /* PL_rsfp_filters entries have fake IoDIRP() */
9394                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9395                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9396                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9397                     /* I have no idea why fake dirp (rsfps)
9398                        should be treated differently but otherwise
9399                        we end up with leaks -- sky*/
9400                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9401                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9402                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9403                 } else {
9404                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9405                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9406                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9407                 }
9408                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9409                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9410                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9411                 break;
9412             case SVt_PVAV:
9413                 if (AvARRAY((AV*)sstr)) {
9414                     SV **dst_ary, **src_ary;
9415                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9416
9417                     src_ary = AvARRAY((AV*)sstr);
9418                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9419                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9420                     SvPV_set(dstr, (char*)dst_ary);
9421                     AvALLOC((AV*)dstr) = dst_ary;
9422                     if (AvREAL((AV*)sstr)) {
9423                         while (items-- > 0)
9424                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9425                     }
9426                     else {
9427                         while (items-- > 0)
9428                             *dst_ary++ = sv_dup(*src_ary++, param);
9429                     }
9430                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9431                     while (items-- > 0) {
9432                         *dst_ary++ = &PL_sv_undef;
9433                     }
9434                 }
9435                 else {
9436                     SvPV_set(dstr, Nullch);
9437                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9438                 }
9439                 break;
9440             case SVt_PVHV:
9441                 {
9442                     HEK *hvname = 0;
9443
9444                     if (HvARRAY((HV*)sstr)) {
9445                         STRLEN i = 0;
9446                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9447                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9448                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9449                         char *darray;
9450                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9451                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9452                             char);
9453                         HvARRAY(dstr) = (HE**)darray;
9454                         while (i <= sxhv->xhv_max) {
9455                             const HE *source = HvARRAY(sstr)[i];
9456                             HvARRAY(dstr)[i] = source
9457                                 ? he_dup(source, sharekeys, param) : 0;
9458                             ++i;
9459                         }
9460                         if (SvOOK(sstr)) {
9461                             struct xpvhv_aux * const saux = HvAUX(sstr);
9462                             struct xpvhv_aux * const daux = HvAUX(dstr);
9463                             /* This flag isn't copied.  */
9464                             /* SvOOK_on(hv) attacks the IV flags.  */
9465                             SvFLAGS(dstr) |= SVf_OOK;
9466
9467                             hvname = saux->xhv_name;
9468                             daux->xhv_name
9469                                 = hvname ? hek_dup(hvname, param) : hvname;
9470
9471                             daux->xhv_riter = saux->xhv_riter;
9472                             daux->xhv_eiter = saux->xhv_eiter
9473                                 ? he_dup(saux->xhv_eiter,
9474                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9475                         }
9476                     }
9477                     else {
9478                         SvPV_set(dstr, Nullch);
9479                     }
9480                     /* Record stashes for possible cloning in Perl_clone(). */
9481                     if(hvname)
9482                         av_push(param->stashes, dstr);
9483                 }
9484                 break;
9485             case SVt_PVFM:
9486             case SVt_PVCV:
9487                 /* NOTE: not refcounted */
9488                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9489                 OP_REFCNT_LOCK;
9490                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9491                 OP_REFCNT_UNLOCK;
9492                 if (CvCONST(dstr)) {
9493                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9494                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9495                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9496                 }
9497                 /* don't dup if copying back - CvGV isn't refcounted, so the
9498                  * duped GV may never be freed. A bit of a hack! DAPM */
9499                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9500                     Nullgv : gv_dup(CvGV(dstr), param) ;
9501                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9502                     CvDEPTH(dstr) = 0;
9503                 }
9504                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9505                 CvOUTSIDE(dstr) =
9506                     CvWEAKOUTSIDE(sstr)
9507                     ? cv_dup(    CvOUTSIDE(dstr), param)
9508                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9509                 if (!CvXSUB(dstr))
9510                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9511                 break;
9512             }
9513         }
9514     }
9515
9516     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9517         ++PL_sv_objcount;
9518
9519     return dstr;
9520  }
9521
9522 /* duplicate a context */
9523
9524 PERL_CONTEXT *
9525 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9526 {
9527     PERL_CONTEXT *ncxs;
9528
9529     if (!cxs)
9530         return (PERL_CONTEXT*)NULL;
9531
9532     /* look for it in the table first */
9533     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9534     if (ncxs)
9535         return ncxs;
9536
9537     /* create anew and remember what it is */
9538     Newxz(ncxs, max + 1, PERL_CONTEXT);
9539     ptr_table_store(PL_ptr_table, cxs, ncxs);
9540
9541     while (ix >= 0) {
9542         PERL_CONTEXT *cx = &cxs[ix];
9543         PERL_CONTEXT *ncx = &ncxs[ix];
9544         ncx->cx_type    = cx->cx_type;
9545         if (CxTYPE(cx) == CXt_SUBST) {
9546             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9547         }
9548         else {
9549             ncx->blk_oldsp      = cx->blk_oldsp;
9550             ncx->blk_oldcop     = cx->blk_oldcop;
9551             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9552             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9553             ncx->blk_oldpm      = cx->blk_oldpm;
9554             ncx->blk_gimme      = cx->blk_gimme;
9555             switch (CxTYPE(cx)) {
9556             case CXt_SUB:
9557                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9558                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9559                                            : cv_dup(cx->blk_sub.cv,param));
9560                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9561                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9562                                            : NULL);
9563                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9564                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9565                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9566                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9567                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9568                 break;
9569             case CXt_EVAL:
9570                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9571                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9572                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9573                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9574                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9575                 ncx->blk_eval.retop = cx->blk_eval.retop;
9576                 break;
9577             case CXt_LOOP:
9578                 ncx->blk_loop.label     = cx->blk_loop.label;
9579                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9580                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9581                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9582                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9583                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9584                                            ? cx->blk_loop.iterdata
9585                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9586                 ncx->blk_loop.oldcomppad
9587                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9588                                             cx->blk_loop.oldcomppad);
9589                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9590                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9591                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9592                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9593                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9594                 break;
9595             case CXt_FORMAT:
9596                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9597                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9598                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9599                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9600                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9601                 break;
9602             case CXt_BLOCK:
9603             case CXt_NULL:
9604                 break;
9605             }
9606         }
9607         --ix;
9608     }
9609     return ncxs;
9610 }
9611
9612 /* duplicate a stack info structure */
9613
9614 PERL_SI *
9615 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9616 {
9617     PERL_SI *nsi;
9618
9619     if (!si)
9620         return (PERL_SI*)NULL;
9621
9622     /* look for it in the table first */
9623     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9624     if (nsi)
9625         return nsi;
9626
9627     /* create anew and remember what it is */
9628     Newxz(nsi, 1, PERL_SI);
9629     ptr_table_store(PL_ptr_table, si, nsi);
9630
9631     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9632     nsi->si_cxix        = si->si_cxix;
9633     nsi->si_cxmax       = si->si_cxmax;
9634     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9635     nsi->si_type        = si->si_type;
9636     nsi->si_prev        = si_dup(si->si_prev, param);
9637     nsi->si_next        = si_dup(si->si_next, param);
9638     nsi->si_markoff     = si->si_markoff;
9639
9640     return nsi;
9641 }
9642
9643 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9644 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9645 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9646 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9647 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9648 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9649 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9650 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9651 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9652 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9653 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9654 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9655 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9656 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9657
9658 /* XXXXX todo */
9659 #define pv_dup_inc(p)   SAVEPV(p)
9660 #define pv_dup(p)       SAVEPV(p)
9661 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9662
9663 /* map any object to the new equivent - either something in the
9664  * ptr table, or something in the interpreter structure
9665  */
9666
9667 void *
9668 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9669 {
9670     void *ret;
9671
9672     if (!v)
9673         return (void*)NULL;
9674
9675     /* look for it in the table first */
9676     ret = ptr_table_fetch(PL_ptr_table, v);
9677     if (ret)
9678         return ret;
9679
9680     /* see if it is part of the interpreter structure */
9681     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9682         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9683     else {
9684         ret = v;
9685     }
9686
9687     return ret;
9688 }
9689
9690 /* duplicate the save stack */
9691
9692 ANY *
9693 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9694 {
9695     ANY * const ss      = proto_perl->Tsavestack;
9696     const I32 max       = proto_perl->Tsavestack_max;
9697     I32 ix              = proto_perl->Tsavestack_ix;
9698     ANY *nss;
9699     SV *sv;
9700     GV *gv;
9701     AV *av;
9702     HV *hv;
9703     void* ptr;
9704     int intval;
9705     long longval;
9706     GP *gp;
9707     IV iv;
9708     char *c = NULL;
9709     void (*dptr) (void*);
9710     void (*dxptr) (pTHX_ void*);
9711
9712     Newxz(nss, max, ANY);
9713
9714     while (ix > 0) {
9715         I32 i = POPINT(ss,ix);
9716         TOPINT(nss,ix) = i;
9717         switch (i) {
9718         case SAVEt_ITEM:                        /* normal string */
9719             sv = (SV*)POPPTR(ss,ix);
9720             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9721             sv = (SV*)POPPTR(ss,ix);
9722             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9723             break;
9724         case SAVEt_SV:                          /* scalar reference */
9725             sv = (SV*)POPPTR(ss,ix);
9726             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9727             gv = (GV*)POPPTR(ss,ix);
9728             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9729             break;
9730         case SAVEt_GENERIC_PVREF:               /* generic char* */
9731             c = (char*)POPPTR(ss,ix);
9732             TOPPTR(nss,ix) = pv_dup(c);
9733             ptr = POPPTR(ss,ix);
9734             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9735             break;
9736         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9737             c = (char*)POPPTR(ss,ix);
9738             TOPPTR(nss,ix) = savesharedpv(c);
9739             ptr = POPPTR(ss,ix);
9740             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9741             break;
9742         case SAVEt_GENERIC_SVREF:               /* generic sv */
9743         case SAVEt_SVREF:                       /* scalar reference */
9744             sv = (SV*)POPPTR(ss,ix);
9745             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9746             ptr = POPPTR(ss,ix);
9747             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9748             break;
9749         case SAVEt_AV:                          /* array reference */
9750             av = (AV*)POPPTR(ss,ix);
9751             TOPPTR(nss,ix) = av_dup_inc(av, param);
9752             gv = (GV*)POPPTR(ss,ix);
9753             TOPPTR(nss,ix) = gv_dup(gv, param);
9754             break;
9755         case SAVEt_HV:                          /* hash reference */
9756             hv = (HV*)POPPTR(ss,ix);
9757             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9758             gv = (GV*)POPPTR(ss,ix);
9759             TOPPTR(nss,ix) = gv_dup(gv, param);
9760             break;
9761         case SAVEt_INT:                         /* int reference */
9762             ptr = POPPTR(ss,ix);
9763             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9764             intval = (int)POPINT(ss,ix);
9765             TOPINT(nss,ix) = intval;
9766             break;
9767         case SAVEt_LONG:                        /* long reference */
9768             ptr = POPPTR(ss,ix);
9769             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9770             longval = (long)POPLONG(ss,ix);
9771             TOPLONG(nss,ix) = longval;
9772             break;
9773         case SAVEt_I32:                         /* I32 reference */
9774         case SAVEt_I16:                         /* I16 reference */
9775         case SAVEt_I8:                          /* I8 reference */
9776             ptr = POPPTR(ss,ix);
9777             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9778             i = POPINT(ss,ix);
9779             TOPINT(nss,ix) = i;
9780             break;
9781         case SAVEt_IV:                          /* IV reference */
9782             ptr = POPPTR(ss,ix);
9783             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9784             iv = POPIV(ss,ix);
9785             TOPIV(nss,ix) = iv;
9786             break;
9787         case SAVEt_SPTR:                        /* SV* reference */
9788             ptr = POPPTR(ss,ix);
9789             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9790             sv = (SV*)POPPTR(ss,ix);
9791             TOPPTR(nss,ix) = sv_dup(sv, param);
9792             break;
9793         case SAVEt_VPTR:                        /* random* reference */
9794             ptr = POPPTR(ss,ix);
9795             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9796             ptr = POPPTR(ss,ix);
9797             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9798             break;
9799         case SAVEt_PPTR:                        /* char* reference */
9800             ptr = POPPTR(ss,ix);
9801             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9802             c = (char*)POPPTR(ss,ix);
9803             TOPPTR(nss,ix) = pv_dup(c);
9804             break;
9805         case SAVEt_HPTR:                        /* HV* reference */
9806             ptr = POPPTR(ss,ix);
9807             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9808             hv = (HV*)POPPTR(ss,ix);
9809             TOPPTR(nss,ix) = hv_dup(hv, param);
9810             break;
9811         case SAVEt_APTR:                        /* AV* reference */
9812             ptr = POPPTR(ss,ix);
9813             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9814             av = (AV*)POPPTR(ss,ix);
9815             TOPPTR(nss,ix) = av_dup(av, param);
9816             break;
9817         case SAVEt_NSTAB:
9818             gv = (GV*)POPPTR(ss,ix);
9819             TOPPTR(nss,ix) = gv_dup(gv, param);
9820             break;
9821         case SAVEt_GP:                          /* scalar reference */
9822             gp = (GP*)POPPTR(ss,ix);
9823             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
9824             (void)GpREFCNT_inc(gp);
9825             gv = (GV*)POPPTR(ss,ix);
9826             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9827             c = (char*)POPPTR(ss,ix);
9828             TOPPTR(nss,ix) = pv_dup(c);
9829             iv = POPIV(ss,ix);
9830             TOPIV(nss,ix) = iv;
9831             iv = POPIV(ss,ix);
9832             TOPIV(nss,ix) = iv;
9833             break;
9834         case SAVEt_FREESV:
9835         case SAVEt_MORTALIZESV:
9836             sv = (SV*)POPPTR(ss,ix);
9837             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9838             break;
9839         case SAVEt_FREEOP:
9840             ptr = POPPTR(ss,ix);
9841             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
9842                 /* these are assumed to be refcounted properly */
9843                 OP *o;
9844                 switch (((OP*)ptr)->op_type) {
9845                 case OP_LEAVESUB:
9846                 case OP_LEAVESUBLV:
9847                 case OP_LEAVEEVAL:
9848                 case OP_LEAVE:
9849                 case OP_SCOPE:
9850                 case OP_LEAVEWRITE:
9851                     TOPPTR(nss,ix) = ptr;
9852                     o = (OP*)ptr;
9853                     OpREFCNT_inc(o);
9854                     break;
9855                 default:
9856                     TOPPTR(nss,ix) = Nullop;
9857                     break;
9858                 }
9859             }
9860             else
9861                 TOPPTR(nss,ix) = Nullop;
9862             break;
9863         case SAVEt_FREEPV:
9864             c = (char*)POPPTR(ss,ix);
9865             TOPPTR(nss,ix) = pv_dup_inc(c);
9866             break;
9867         case SAVEt_CLEARSV:
9868             longval = POPLONG(ss,ix);
9869             TOPLONG(nss,ix) = longval;
9870             break;
9871         case SAVEt_DELETE:
9872             hv = (HV*)POPPTR(ss,ix);
9873             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9874             c = (char*)POPPTR(ss,ix);
9875             TOPPTR(nss,ix) = pv_dup_inc(c);
9876             i = POPINT(ss,ix);
9877             TOPINT(nss,ix) = i;
9878             break;
9879         case SAVEt_DESTRUCTOR:
9880             ptr = POPPTR(ss,ix);
9881             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9882             dptr = POPDPTR(ss,ix);
9883             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
9884                                         any_dup(FPTR2DPTR(void *, dptr),
9885                                                 proto_perl));
9886             break;
9887         case SAVEt_DESTRUCTOR_X:
9888             ptr = POPPTR(ss,ix);
9889             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9890             dxptr = POPDXPTR(ss,ix);
9891             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
9892                                          any_dup(FPTR2DPTR(void *, dxptr),
9893                                                  proto_perl));
9894             break;
9895         case SAVEt_REGCONTEXT:
9896         case SAVEt_ALLOC:
9897             i = POPINT(ss,ix);
9898             TOPINT(nss,ix) = i;
9899             ix -= i;
9900             break;
9901         case SAVEt_STACK_POS:           /* Position on Perl stack */
9902             i = POPINT(ss,ix);
9903             TOPINT(nss,ix) = i;
9904             break;
9905         case SAVEt_AELEM:               /* array element */
9906             sv = (SV*)POPPTR(ss,ix);
9907             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9908             i = POPINT(ss,ix);
9909             TOPINT(nss,ix) = i;
9910             av = (AV*)POPPTR(ss,ix);
9911             TOPPTR(nss,ix) = av_dup_inc(av, param);
9912             break;
9913         case SAVEt_HELEM:               /* hash element */
9914             sv = (SV*)POPPTR(ss,ix);
9915             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9916             sv = (SV*)POPPTR(ss,ix);
9917             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9918             hv = (HV*)POPPTR(ss,ix);
9919             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9920             break;
9921         case SAVEt_OP:
9922             ptr = POPPTR(ss,ix);
9923             TOPPTR(nss,ix) = ptr;
9924             break;
9925         case SAVEt_HINTS:
9926             i = POPINT(ss,ix);
9927             TOPINT(nss,ix) = i;
9928             break;
9929         case SAVEt_COMPPAD:
9930             av = (AV*)POPPTR(ss,ix);
9931             TOPPTR(nss,ix) = av_dup(av, param);
9932             break;
9933         case SAVEt_PADSV:
9934             longval = (long)POPLONG(ss,ix);
9935             TOPLONG(nss,ix) = longval;
9936             ptr = POPPTR(ss,ix);
9937             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9938             sv = (SV*)POPPTR(ss,ix);
9939             TOPPTR(nss,ix) = sv_dup(sv, param);
9940             break;
9941         case SAVEt_BOOL:
9942             ptr = POPPTR(ss,ix);
9943             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9944             longval = (long)POPBOOL(ss,ix);
9945             TOPBOOL(nss,ix) = (bool)longval;
9946             break;
9947         case SAVEt_SET_SVFLAGS:
9948             i = POPINT(ss,ix);
9949             TOPINT(nss,ix) = i;
9950             i = POPINT(ss,ix);
9951             TOPINT(nss,ix) = i;
9952             sv = (SV*)POPPTR(ss,ix);
9953             TOPPTR(nss,ix) = sv_dup(sv, param);
9954             break;
9955         default:
9956             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
9957         }
9958     }
9959
9960     return nss;
9961 }
9962
9963
9964 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
9965  * flag to the result. This is done for each stash before cloning starts,
9966  * so we know which stashes want their objects cloned */
9967
9968 static void
9969 do_mark_cloneable_stash(pTHX_ SV *sv)
9970 {
9971     const HEK * const hvname = HvNAME_HEK((HV*)sv);
9972     if (hvname) {
9973         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
9974         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
9975         if (cloner && GvCV(cloner)) {
9976             dSP;
9977             UV status;
9978
9979             ENTER;
9980             SAVETMPS;
9981             PUSHMARK(SP);
9982             XPUSHs(sv_2mortal(newSVhek(hvname)));
9983             PUTBACK;
9984             call_sv((SV*)GvCV(cloner), G_SCALAR);
9985             SPAGAIN;
9986             status = POPu;
9987             PUTBACK;
9988             FREETMPS;
9989             LEAVE;
9990             if (status)
9991                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
9992         }
9993     }
9994 }
9995
9996
9997
9998 /*
9999 =for apidoc perl_clone
10000
10001 Create and return a new interpreter by cloning the current one.
10002
10003 perl_clone takes these flags as parameters:
10004
10005 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10006 without it we only clone the data and zero the stacks,
10007 with it we copy the stacks and the new perl interpreter is
10008 ready to run at the exact same point as the previous one.
10009 The pseudo-fork code uses COPY_STACKS while the
10010 threads->new doesn't.
10011
10012 CLONEf_KEEP_PTR_TABLE
10013 perl_clone keeps a ptr_table with the pointer of the old
10014 variable as a key and the new variable as a value,
10015 this allows it to check if something has been cloned and not
10016 clone it again but rather just use the value and increase the
10017 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10018 the ptr_table using the function
10019 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10020 reason to keep it around is if you want to dup some of your own
10021 variable who are outside the graph perl scans, example of this
10022 code is in threads.xs create
10023
10024 CLONEf_CLONE_HOST
10025 This is a win32 thing, it is ignored on unix, it tells perls
10026 win32host code (which is c++) to clone itself, this is needed on
10027 win32 if you want to run two threads at the same time,
10028 if you just want to do some stuff in a separate perl interpreter
10029 and then throw it away and return to the original one,
10030 you don't need to do anything.
10031
10032 =cut
10033 */
10034
10035 /* XXX the above needs expanding by someone who actually understands it ! */
10036 EXTERN_C PerlInterpreter *
10037 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10038
10039 PerlInterpreter *
10040 perl_clone(PerlInterpreter *proto_perl, UV flags)
10041 {
10042    dVAR;
10043 #ifdef PERL_IMPLICIT_SYS
10044
10045    /* perlhost.h so we need to call into it
10046    to clone the host, CPerlHost should have a c interface, sky */
10047
10048    if (flags & CLONEf_CLONE_HOST) {
10049        return perl_clone_host(proto_perl,flags);
10050    }
10051    return perl_clone_using(proto_perl, flags,
10052                             proto_perl->IMem,
10053                             proto_perl->IMemShared,
10054                             proto_perl->IMemParse,
10055                             proto_perl->IEnv,
10056                             proto_perl->IStdIO,
10057                             proto_perl->ILIO,
10058                             proto_perl->IDir,
10059                             proto_perl->ISock,
10060                             proto_perl->IProc);
10061 }
10062
10063 PerlInterpreter *
10064 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10065                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10066                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10067                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10068                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10069                  struct IPerlProc* ipP)
10070 {
10071     /* XXX many of the string copies here can be optimized if they're
10072      * constants; they need to be allocated as common memory and just
10073      * their pointers copied. */
10074
10075     IV i;
10076     CLONE_PARAMS clone_params;
10077     CLONE_PARAMS* param = &clone_params;
10078
10079     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10080     /* for each stash, determine whether its objects should be cloned */
10081     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10082     PERL_SET_THX(my_perl);
10083
10084 #  ifdef DEBUGGING
10085     Poison(my_perl, 1, PerlInterpreter);
10086     PL_op = Nullop;
10087     PL_curcop = (COP *)Nullop;
10088     PL_markstack = 0;
10089     PL_scopestack = 0;
10090     PL_savestack = 0;
10091     PL_savestack_ix = 0;
10092     PL_savestack_max = -1;
10093     PL_sig_pending = 0;
10094     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10095 #  else /* !DEBUGGING */
10096     Zero(my_perl, 1, PerlInterpreter);
10097 #  endif        /* DEBUGGING */
10098
10099     /* host pointers */
10100     PL_Mem              = ipM;
10101     PL_MemShared        = ipMS;
10102     PL_MemParse         = ipMP;
10103     PL_Env              = ipE;
10104     PL_StdIO            = ipStd;
10105     PL_LIO              = ipLIO;
10106     PL_Dir              = ipD;
10107     PL_Sock             = ipS;
10108     PL_Proc             = ipP;
10109 #else           /* !PERL_IMPLICIT_SYS */
10110     IV i;
10111     CLONE_PARAMS clone_params;
10112     CLONE_PARAMS* param = &clone_params;
10113     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10114     /* for each stash, determine whether its objects should be cloned */
10115     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10116     PERL_SET_THX(my_perl);
10117
10118 #    ifdef DEBUGGING
10119     Poison(my_perl, 1, PerlInterpreter);
10120     PL_op = Nullop;
10121     PL_curcop = (COP *)Nullop;
10122     PL_markstack = 0;
10123     PL_scopestack = 0;
10124     PL_savestack = 0;
10125     PL_savestack_ix = 0;
10126     PL_savestack_max = -1;
10127     PL_sig_pending = 0;
10128     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10129 #    else       /* !DEBUGGING */
10130     Zero(my_perl, 1, PerlInterpreter);
10131 #    endif      /* DEBUGGING */
10132 #endif          /* PERL_IMPLICIT_SYS */
10133     param->flags = flags;
10134     param->proto_perl = proto_perl;
10135
10136     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10137     Zero(&PL_body_roots, 1, PL_body_roots);
10138     
10139     PL_nice_chunk       = NULL;
10140     PL_nice_chunk_size  = 0;
10141     PL_sv_count         = 0;
10142     PL_sv_objcount      = 0;
10143     PL_sv_root          = Nullsv;
10144     PL_sv_arenaroot     = Nullsv;
10145
10146     PL_debug            = proto_perl->Idebug;
10147
10148     PL_hash_seed        = proto_perl->Ihash_seed;
10149     PL_rehash_seed      = proto_perl->Irehash_seed;
10150
10151 #ifdef USE_REENTRANT_API
10152     /* XXX: things like -Dm will segfault here in perlio, but doing
10153      *  PERL_SET_CONTEXT(proto_perl);
10154      * breaks too many other things
10155      */
10156     Perl_reentrant_init(aTHX);
10157 #endif
10158
10159     /* create SV map for pointer relocation */
10160     PL_ptr_table = ptr_table_new();
10161
10162     /* initialize these special pointers as early as possible */
10163     SvANY(&PL_sv_undef)         = NULL;
10164     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10165     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10166     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10167
10168     SvANY(&PL_sv_no)            = new_XPVNV();
10169     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10170     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10171                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10172     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10173     SvCUR_set(&PL_sv_no, 0);
10174     SvLEN_set(&PL_sv_no, 1);
10175     SvIV_set(&PL_sv_no, 0);
10176     SvNV_set(&PL_sv_no, 0);
10177     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10178
10179     SvANY(&PL_sv_yes)           = new_XPVNV();
10180     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10181     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10182                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10183     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10184     SvCUR_set(&PL_sv_yes, 1);
10185     SvLEN_set(&PL_sv_yes, 2);
10186     SvIV_set(&PL_sv_yes, 1);
10187     SvNV_set(&PL_sv_yes, 1);
10188     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10189
10190     /* create (a non-shared!) shared string table */
10191     PL_strtab           = newHV();
10192     HvSHAREKEYS_off(PL_strtab);
10193     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10194     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10195
10196     PL_compiling = proto_perl->Icompiling;
10197
10198     /* These two PVs will be free'd special way so must set them same way op.c does */
10199     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10200     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10201
10202     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10203     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10204
10205     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10206     if (!specialWARN(PL_compiling.cop_warnings))
10207         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10208     if (!specialCopIO(PL_compiling.cop_io))
10209         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10210     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10211
10212     /* pseudo environmental stuff */
10213     PL_origargc         = proto_perl->Iorigargc;
10214     PL_origargv         = proto_perl->Iorigargv;
10215
10216     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10217
10218     /* Set tainting stuff before PerlIO_debug can possibly get called */
10219     PL_tainting         = proto_perl->Itainting;
10220     PL_taint_warn       = proto_perl->Itaint_warn;
10221
10222 #ifdef PERLIO_LAYERS
10223     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10224     PerlIO_clone(aTHX_ proto_perl, param);
10225 #endif
10226
10227     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10228     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10229     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10230     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10231     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10232     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10233
10234     /* switches */
10235     PL_minus_c          = proto_perl->Iminus_c;
10236     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10237     PL_localpatches     = proto_perl->Ilocalpatches;
10238     PL_splitstr         = proto_perl->Isplitstr;
10239     PL_preprocess       = proto_perl->Ipreprocess;
10240     PL_minus_n          = proto_perl->Iminus_n;
10241     PL_minus_p          = proto_perl->Iminus_p;
10242     PL_minus_l          = proto_perl->Iminus_l;
10243     PL_minus_a          = proto_perl->Iminus_a;
10244     PL_minus_E          = proto_perl->Iminus_E;
10245     PL_minus_F          = proto_perl->Iminus_F;
10246     PL_doswitches       = proto_perl->Idoswitches;
10247     PL_dowarn           = proto_perl->Idowarn;
10248     PL_doextract        = proto_perl->Idoextract;
10249     PL_sawampersand     = proto_perl->Isawampersand;
10250     PL_unsafe           = proto_perl->Iunsafe;
10251     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10252     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10253     PL_perldb           = proto_perl->Iperldb;
10254     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10255     PL_exit_flags       = proto_perl->Iexit_flags;
10256
10257     /* magical thingies */
10258     /* XXX time(&PL_basetime) when asked for? */
10259     PL_basetime         = proto_perl->Ibasetime;
10260     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10261
10262     PL_maxsysfd         = proto_perl->Imaxsysfd;
10263     PL_multiline        = proto_perl->Imultiline;
10264     PL_statusvalue      = proto_perl->Istatusvalue;
10265 #ifdef VMS
10266     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10267 #else
10268     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10269 #endif
10270     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10271
10272     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10273     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10274     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10275
10276     /* Clone the regex array */
10277     PL_regex_padav = newAV();
10278     {
10279         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10280         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10281         IV i;
10282         av_push(PL_regex_padav,
10283                 sv_dup_inc(regexen[0],param));
10284         for(i = 1; i <= len; i++) {
10285             if(SvREPADTMP(regexen[i])) {
10286               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10287             } else {
10288                 av_push(PL_regex_padav,
10289                     SvREFCNT_inc(
10290                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10291                              SvIVX(regexen[i])), param)))
10292                        ));
10293             }
10294         }
10295     }
10296     PL_regex_pad = AvARRAY(PL_regex_padav);
10297
10298     /* shortcuts to various I/O objects */
10299     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10300     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10301     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10302     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10303     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10304     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10305
10306     /* shortcuts to regexp stuff */
10307     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10308
10309     /* shortcuts to misc objects */
10310     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10311
10312     /* shortcuts to debugging objects */
10313     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10314     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10315     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10316     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10317     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10318     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10319     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10320     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10321     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10322
10323     /* symbol tables */
10324     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10325     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10326     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10327     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10328     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10329
10330     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10331     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10332     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10333     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10334     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10335     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10336
10337     PL_sub_generation   = proto_perl->Isub_generation;
10338
10339     /* funky return mechanisms */
10340     PL_forkprocess      = proto_perl->Iforkprocess;
10341
10342     /* subprocess state */
10343     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10344
10345     /* internal state */
10346     PL_maxo             = proto_perl->Imaxo;
10347     if (proto_perl->Iop_mask)
10348         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10349     else
10350         PL_op_mask      = Nullch;
10351     /* PL_asserting        = proto_perl->Iasserting; */
10352
10353     /* current interpreter roots */
10354     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10355     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10356     PL_main_start       = proto_perl->Imain_start;
10357     PL_eval_root        = proto_perl->Ieval_root;
10358     PL_eval_start       = proto_perl->Ieval_start;
10359
10360     /* runtime control stuff */
10361     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10362     PL_copline          = proto_perl->Icopline;
10363
10364     PL_filemode         = proto_perl->Ifilemode;
10365     PL_lastfd           = proto_perl->Ilastfd;
10366     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10367     PL_Argv             = NULL;
10368     PL_Cmd              = Nullch;
10369     PL_gensym           = proto_perl->Igensym;
10370     PL_preambled        = proto_perl->Ipreambled;
10371     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10372     PL_laststatval      = proto_perl->Ilaststatval;
10373     PL_laststype        = proto_perl->Ilaststype;
10374     PL_mess_sv          = Nullsv;
10375
10376     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10377
10378     /* interpreter atexit processing */
10379     PL_exitlistlen      = proto_perl->Iexitlistlen;
10380     if (PL_exitlistlen) {
10381         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10382         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10383     }
10384     else
10385         PL_exitlist     = (PerlExitListEntry*)NULL;
10386     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10387     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10388     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10389
10390     PL_profiledata      = NULL;
10391     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10392     /* PL_rsfp_filters entries have fake IoDIRP() */
10393     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10394
10395     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10396
10397     PAD_CLONE_VARS(proto_perl, param);
10398
10399 #ifdef HAVE_INTERP_INTERN
10400     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10401 #endif
10402
10403     /* more statics moved here */
10404     PL_generation       = proto_perl->Igeneration;
10405     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10406
10407     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10408     PL_in_clean_all     = proto_perl->Iin_clean_all;
10409
10410     PL_uid              = proto_perl->Iuid;
10411     PL_euid             = proto_perl->Ieuid;
10412     PL_gid              = proto_perl->Igid;
10413     PL_egid             = proto_perl->Iegid;
10414     PL_nomemok          = proto_perl->Inomemok;
10415     PL_an               = proto_perl->Ian;
10416     PL_evalseq          = proto_perl->Ievalseq;
10417     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10418     PL_origalen         = proto_perl->Iorigalen;
10419 #ifdef PERL_USES_PL_PIDSTATUS
10420     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10421 #endif
10422     PL_osname           = SAVEPV(proto_perl->Iosname);
10423     PL_sighandlerp      = proto_perl->Isighandlerp;
10424
10425     PL_runops           = proto_perl->Irunops;
10426
10427     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10428
10429 #ifdef CSH
10430     PL_cshlen           = proto_perl->Icshlen;
10431     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10432 #endif
10433
10434     PL_lex_state        = proto_perl->Ilex_state;
10435     PL_lex_defer        = proto_perl->Ilex_defer;
10436     PL_lex_expect       = proto_perl->Ilex_expect;
10437     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10438     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10439     PL_lex_starts       = proto_perl->Ilex_starts;
10440     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10441     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10442     PL_lex_op           = proto_perl->Ilex_op;
10443     PL_lex_inpat        = proto_perl->Ilex_inpat;
10444     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10445     PL_lex_brackets     = proto_perl->Ilex_brackets;
10446     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10447     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10448     PL_lex_casemods     = proto_perl->Ilex_casemods;
10449     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10450     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10451
10452     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10453     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10454     PL_nexttoke         = proto_perl->Inexttoke;
10455
10456     /* XXX This is probably masking the deeper issue of why
10457      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10458      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10459      * (A little debugging with a watchpoint on it may help.)
10460      */
10461     if (SvANY(proto_perl->Ilinestr)) {
10462         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10463         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10464         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10465         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10466         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10467         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10468         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10469         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10470         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10471     }
10472     else {
10473         PL_linestr = NEWSV(65,79);
10474         sv_upgrade(PL_linestr,SVt_PVIV);
10475         sv_setpvn(PL_linestr,"",0);
10476         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10477     }
10478     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10479     PL_pending_ident    = proto_perl->Ipending_ident;
10480     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10481
10482     PL_expect           = proto_perl->Iexpect;
10483
10484     PL_multi_start      = proto_perl->Imulti_start;
10485     PL_multi_end        = proto_perl->Imulti_end;
10486     PL_multi_open       = proto_perl->Imulti_open;
10487     PL_multi_close      = proto_perl->Imulti_close;
10488
10489     PL_error_count      = proto_perl->Ierror_count;
10490     PL_subline          = proto_perl->Isubline;
10491     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10492
10493     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10494     if (SvANY(proto_perl->Ilinestr)) {
10495         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10496         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10497         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10498         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10499         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10500     }
10501     else {
10502         PL_last_uni     = SvPVX(PL_linestr);
10503         PL_last_lop     = SvPVX(PL_linestr);
10504         PL_last_lop_op  = 0;
10505     }
10506     PL_in_my            = proto_perl->Iin_my;
10507     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10508 #ifdef FCRYPT
10509     PL_cryptseen        = proto_perl->Icryptseen;
10510 #endif
10511
10512     PL_hints            = proto_perl->Ihints;
10513
10514     PL_amagic_generation        = proto_perl->Iamagic_generation;
10515
10516 #ifdef USE_LOCALE_COLLATE
10517     PL_collation_ix     = proto_perl->Icollation_ix;
10518     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10519     PL_collation_standard       = proto_perl->Icollation_standard;
10520     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10521     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10522 #endif /* USE_LOCALE_COLLATE */
10523
10524 #ifdef USE_LOCALE_NUMERIC
10525     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10526     PL_numeric_standard = proto_perl->Inumeric_standard;
10527     PL_numeric_local    = proto_perl->Inumeric_local;
10528     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10529 #endif /* !USE_LOCALE_NUMERIC */
10530
10531     /* utf8 character classes */
10532     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10533     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10534     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10535     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10536     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10537     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10538     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10539     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10540     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10541     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10542     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10543     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10544     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10545     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10546     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10547     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10548     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10549     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10550     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10551     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10552
10553     /* Did the locale setup indicate UTF-8? */
10554     PL_utf8locale       = proto_perl->Iutf8locale;
10555     /* Unicode features (see perlrun/-C) */
10556     PL_unicode          = proto_perl->Iunicode;
10557
10558     /* Pre-5.8 signals control */
10559     PL_signals          = proto_perl->Isignals;
10560
10561     /* times() ticks per second */
10562     PL_clocktick        = proto_perl->Iclocktick;
10563
10564     /* Recursion stopper for PerlIO_find_layer */
10565     PL_in_load_module   = proto_perl->Iin_load_module;
10566
10567     /* sort() routine */
10568     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10569
10570     /* Not really needed/useful since the reenrant_retint is "volatile",
10571      * but do it for consistency's sake. */
10572     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10573
10574     /* Hooks to shared SVs and locks. */
10575     PL_sharehook        = proto_perl->Isharehook;
10576     PL_lockhook         = proto_perl->Ilockhook;
10577     PL_unlockhook       = proto_perl->Iunlockhook;
10578     PL_threadhook       = proto_perl->Ithreadhook;
10579
10580     PL_runops_std       = proto_perl->Irunops_std;
10581     PL_runops_dbg       = proto_perl->Irunops_dbg;
10582
10583 #ifdef THREADS_HAVE_PIDS
10584     PL_ppid             = proto_perl->Ippid;
10585 #endif
10586
10587     /* swatch cache */
10588     PL_last_swash_hv    = NULL; /* reinits on demand */
10589     PL_last_swash_klen  = 0;
10590     PL_last_swash_key[0]= '\0';
10591     PL_last_swash_tmps  = (U8*)NULL;
10592     PL_last_swash_slen  = 0;
10593
10594     PL_glob_index       = proto_perl->Iglob_index;
10595     PL_srand_called     = proto_perl->Isrand_called;
10596     PL_uudmap['M']      = 0;            /* reinits on demand */
10597     PL_bitcount         = Nullch;       /* reinits on demand */
10598
10599     if (proto_perl->Ipsig_pend) {
10600         Newxz(PL_psig_pend, SIG_SIZE, int);
10601     }
10602     else {
10603         PL_psig_pend    = (int*)NULL;
10604     }
10605
10606     if (proto_perl->Ipsig_ptr) {
10607         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10608         Newxz(PL_psig_name, SIG_SIZE, SV*);
10609         for (i = 1; i < SIG_SIZE; i++) {
10610             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10611             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10612         }
10613     }
10614     else {
10615         PL_psig_ptr     = (SV**)NULL;
10616         PL_psig_name    = (SV**)NULL;
10617     }
10618
10619     /* thrdvar.h stuff */
10620
10621     if (flags & CLONEf_COPY_STACKS) {
10622         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10623         PL_tmps_ix              = proto_perl->Ttmps_ix;
10624         PL_tmps_max             = proto_perl->Ttmps_max;
10625         PL_tmps_floor           = proto_perl->Ttmps_floor;
10626         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10627         i = 0;
10628         while (i <= PL_tmps_ix) {
10629             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10630             ++i;
10631         }
10632
10633         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10634         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10635         Newxz(PL_markstack, i, I32);
10636         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10637                                                   - proto_perl->Tmarkstack);
10638         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10639                                                   - proto_perl->Tmarkstack);
10640         Copy(proto_perl->Tmarkstack, PL_markstack,
10641              PL_markstack_ptr - PL_markstack + 1, I32);
10642
10643         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10644          * NOTE: unlike the others! */
10645         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10646         PL_scopestack_max       = proto_perl->Tscopestack_max;
10647         Newxz(PL_scopestack, PL_scopestack_max, I32);
10648         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10649
10650         /* NOTE: si_dup() looks at PL_markstack */
10651         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10652
10653         /* PL_curstack          = PL_curstackinfo->si_stack; */
10654         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10655         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10656
10657         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10658         PL_stack_base           = AvARRAY(PL_curstack);
10659         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10660                                                    - proto_perl->Tstack_base);
10661         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10662
10663         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10664          * NOTE: unlike the others! */
10665         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10666         PL_savestack_max        = proto_perl->Tsavestack_max;
10667         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10668         PL_savestack            = ss_dup(proto_perl, param);
10669     }
10670     else {
10671         init_stacks();
10672         ENTER;                  /* perl_destruct() wants to LEAVE; */
10673     }
10674
10675     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10676     PL_top_env          = &PL_start_env;
10677
10678     PL_op               = proto_perl->Top;
10679
10680     PL_Sv               = Nullsv;
10681     PL_Xpv              = (XPV*)NULL;
10682     PL_na               = proto_perl->Tna;
10683
10684     PL_statbuf          = proto_perl->Tstatbuf;
10685     PL_statcache        = proto_perl->Tstatcache;
10686     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10687     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10688 #ifdef HAS_TIMES
10689     PL_timesbuf         = proto_perl->Ttimesbuf;
10690 #endif
10691
10692     PL_tainted          = proto_perl->Ttainted;
10693     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10694     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10695     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10696     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10697     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10698     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10699     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10700     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10701     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10702
10703     PL_restartop        = proto_perl->Trestartop;
10704     PL_in_eval          = proto_perl->Tin_eval;
10705     PL_delaymagic       = proto_perl->Tdelaymagic;
10706     PL_dirty            = proto_perl->Tdirty;
10707     PL_localizing       = proto_perl->Tlocalizing;
10708
10709     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10710     PL_hv_fetch_ent_mh  = Nullhe;
10711     PL_modcount         = proto_perl->Tmodcount;
10712     PL_lastgotoprobe    = Nullop;
10713     PL_dumpindent       = proto_perl->Tdumpindent;
10714
10715     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10716     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10717     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10718     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10719     PL_efloatbuf        = Nullch;               /* reinits on demand */
10720     PL_efloatsize       = 0;                    /* reinits on demand */
10721
10722     /* regex stuff */
10723
10724     PL_screamfirst      = NULL;
10725     PL_screamnext       = NULL;
10726     PL_maxscream        = -1;                   /* reinits on demand */
10727     PL_lastscream       = Nullsv;
10728
10729     PL_watchaddr        = NULL;
10730     PL_watchok          = Nullch;
10731
10732     PL_regdummy         = proto_perl->Tregdummy;
10733     PL_regprecomp       = Nullch;
10734     PL_regnpar          = 0;
10735     PL_regsize          = 0;
10736     PL_colorset         = 0;            /* reinits PL_colors[] */
10737     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10738     PL_reginput         = Nullch;
10739     PL_regbol           = Nullch;
10740     PL_regeol           = Nullch;
10741     PL_regstartp        = (I32*)NULL;
10742     PL_regendp          = (I32*)NULL;
10743     PL_reglastparen     = (U32*)NULL;
10744     PL_reglastcloseparen        = (U32*)NULL;
10745     PL_regtill          = Nullch;
10746     PL_reg_start_tmp    = (char**)NULL;
10747     PL_reg_start_tmpl   = 0;
10748     PL_regdata          = (struct reg_data*)NULL;
10749     PL_bostr            = Nullch;
10750     PL_reg_flags        = 0;
10751     PL_reg_eval_set     = 0;
10752     PL_regnarrate       = 0;
10753     PL_regprogram       = (regnode*)NULL;
10754     PL_regindent        = 0;
10755     PL_regcc            = (CURCUR*)NULL;
10756     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10757     PL_reg_re           = (regexp*)NULL;
10758     PL_reg_ganch        = Nullch;
10759     PL_reg_sv           = Nullsv;
10760     PL_reg_match_utf8   = FALSE;
10761     PL_reg_magic        = (MAGIC*)NULL;
10762     PL_reg_oldpos       = 0;
10763     PL_reg_oldcurpm     = (PMOP*)NULL;
10764     PL_reg_curpm        = (PMOP*)NULL;
10765     PL_reg_oldsaved     = Nullch;
10766     PL_reg_oldsavedlen  = 0;
10767 #ifdef PERL_OLD_COPY_ON_WRITE
10768     PL_nrs              = Nullsv;
10769 #endif
10770     PL_reg_maxiter      = 0;
10771     PL_reg_leftiter     = 0;
10772     PL_reg_poscache     = Nullch;
10773     PL_reg_poscache_size= 0;
10774
10775     /* RE engine - function pointers */
10776     PL_regcompp         = proto_perl->Tregcompp;
10777     PL_regexecp         = proto_perl->Tregexecp;
10778     PL_regint_start     = proto_perl->Tregint_start;
10779     PL_regint_string    = proto_perl->Tregint_string;
10780     PL_regfree          = proto_perl->Tregfree;
10781
10782     PL_reginterp_cnt    = 0;
10783     PL_reg_starttry     = 0;
10784
10785     /* Pluggable optimizer */
10786     PL_peepp            = proto_perl->Tpeepp;
10787
10788     PL_stashcache       = newHV();
10789
10790     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
10791         ptr_table_free(PL_ptr_table);
10792         PL_ptr_table = NULL;
10793     }
10794
10795     /* Call the ->CLONE method, if it exists, for each of the stashes
10796        identified by sv_dup() above.
10797     */
10798     while(av_len(param->stashes) != -1) {
10799         HV* const stash = (HV*) av_shift(param->stashes);
10800         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
10801         if (cloner && GvCV(cloner)) {
10802             dSP;
10803             ENTER;
10804             SAVETMPS;
10805             PUSHMARK(SP);
10806             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
10807             PUTBACK;
10808             call_sv((SV*)GvCV(cloner), G_DISCARD);
10809             FREETMPS;
10810             LEAVE;
10811         }
10812     }
10813
10814     SvREFCNT_dec(param->stashes);
10815
10816     /* orphaned? eg threads->new inside BEGIN or use */
10817     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
10818         (void)SvREFCNT_inc(PL_compcv);
10819         SAVEFREESV(PL_compcv);
10820     }
10821
10822     return my_perl;
10823 }
10824
10825 #endif /* USE_ITHREADS */
10826
10827 /*
10828 =head1 Unicode Support
10829
10830 =for apidoc sv_recode_to_utf8
10831
10832 The encoding is assumed to be an Encode object, on entry the PV
10833 of the sv is assumed to be octets in that encoding, and the sv
10834 will be converted into Unicode (and UTF-8).
10835
10836 If the sv already is UTF-8 (or if it is not POK), or if the encoding
10837 is not a reference, nothing is done to the sv.  If the encoding is not
10838 an C<Encode::XS> Encoding object, bad things will happen.
10839 (See F<lib/encoding.pm> and L<Encode>).
10840
10841 The PV of the sv is returned.
10842
10843 =cut */
10844
10845 char *
10846 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
10847 {
10848     dVAR;
10849     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
10850         SV *uni;
10851         STRLEN len;
10852         const char *s;
10853         dSP;
10854         ENTER;
10855         SAVETMPS;
10856         save_re_context();
10857         PUSHMARK(sp);
10858         EXTEND(SP, 3);
10859         XPUSHs(encoding);
10860         XPUSHs(sv);
10861 /*
10862   NI-S 2002/07/09
10863   Passing sv_yes is wrong - it needs to be or'ed set of constants
10864   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
10865   remove converted chars from source.
10866
10867   Both will default the value - let them.
10868
10869         XPUSHs(&PL_sv_yes);
10870 */
10871         PUTBACK;
10872         call_method("decode", G_SCALAR);
10873         SPAGAIN;
10874         uni = POPs;
10875         PUTBACK;
10876         s = SvPV_const(uni, len);
10877         if (s != SvPVX_const(sv)) {
10878             SvGROW(sv, len + 1);
10879             Move(s, SvPVX(sv), len + 1, char);
10880             SvCUR_set(sv, len);
10881         }
10882         FREETMPS;
10883         LEAVE;
10884         SvUTF8_on(sv);
10885         return SvPVX(sv);
10886     }
10887     return SvPOKp(sv) ? SvPVX(sv) : NULL;
10888 }
10889
10890 /*
10891 =for apidoc sv_cat_decode
10892
10893 The encoding is assumed to be an Encode object, the PV of the ssv is
10894 assumed to be octets in that encoding and decoding the input starts
10895 from the position which (PV + *offset) pointed to.  The dsv will be
10896 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
10897 when the string tstr appears in decoding output or the input ends on
10898 the PV of the ssv. The value which the offset points will be modified
10899 to the last input position on the ssv.
10900
10901 Returns TRUE if the terminator was found, else returns FALSE.
10902
10903 =cut */
10904
10905 bool
10906 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
10907                    SV *ssv, int *offset, char *tstr, int tlen)
10908 {
10909     dVAR;
10910     bool ret = FALSE;
10911     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
10912         SV *offsv;
10913         dSP;
10914         ENTER;
10915         SAVETMPS;
10916         save_re_context();
10917         PUSHMARK(sp);
10918         EXTEND(SP, 6);
10919         XPUSHs(encoding);
10920         XPUSHs(dsv);
10921         XPUSHs(ssv);
10922         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
10923         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
10924         PUTBACK;
10925         call_method("cat_decode", G_SCALAR);
10926         SPAGAIN;
10927         ret = SvTRUE(TOPs);
10928         *offset = SvIV(offsv);
10929         PUTBACK;
10930         FREETMPS;
10931         LEAVE;
10932     }
10933     else
10934         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
10935     return ret;
10936
10937 }
10938
10939 /* ---------------------------------------------------------------------
10940  *
10941  * support functions for report_uninit()
10942  */
10943
10944 /* the maxiumum size of array or hash where we will scan looking
10945  * for the undefined element that triggered the warning */
10946
10947 #define FUV_MAX_SEARCH_SIZE 1000
10948
10949 /* Look for an entry in the hash whose value has the same SV as val;
10950  * If so, return a mortal copy of the key. */
10951
10952 STATIC SV*
10953 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
10954 {
10955     dVAR;
10956     register HE **array;
10957     I32 i;
10958
10959     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
10960                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
10961         return Nullsv;
10962
10963     array = HvARRAY(hv);
10964
10965     for (i=HvMAX(hv); i>0; i--) {
10966         register HE *entry;
10967         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
10968             if (HeVAL(entry) != val)
10969                 continue;
10970             if (    HeVAL(entry) == &PL_sv_undef ||
10971                     HeVAL(entry) == &PL_sv_placeholder)
10972                 continue;
10973             if (!HeKEY(entry))
10974                 return Nullsv;
10975             if (HeKLEN(entry) == HEf_SVKEY)
10976                 return sv_mortalcopy(HeKEY_sv(entry));
10977             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
10978         }
10979     }
10980     return Nullsv;
10981 }
10982
10983 /* Look for an entry in the array whose value has the same SV as val;
10984  * If so, return the index, otherwise return -1. */
10985
10986 STATIC I32
10987 S_find_array_subscript(pTHX_ AV *av, SV* val)
10988 {
10989     SV** svp;
10990     I32 i;
10991     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
10992                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
10993         return -1;
10994
10995     svp = AvARRAY(av);
10996     for (i=AvFILLp(av); i>=0; i--) {
10997         if (svp[i] == val && svp[i] != &PL_sv_undef)
10998             return i;
10999     }
11000     return -1;
11001 }
11002
11003 /* S_varname(): return the name of a variable, optionally with a subscript.
11004  * If gv is non-zero, use the name of that global, along with gvtype (one
11005  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11006  * targ.  Depending on the value of the subscript_type flag, return:
11007  */
11008
11009 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11010 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11011 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11012 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11013
11014 STATIC SV*
11015 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11016         SV* keyname, I32 aindex, int subscript_type)
11017 {
11018
11019     SV * const name = sv_newmortal();
11020     if (gv) {
11021         char buffer[2];
11022         buffer[0] = gvtype;
11023         buffer[1] = 0;
11024
11025         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11026
11027         gv_fullname4(name, gv, buffer, 0);
11028
11029         if ((unsigned int)SvPVX(name)[1] <= 26) {
11030             buffer[0] = '^';
11031             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11032
11033             /* Swap the 1 unprintable control character for the 2 byte pretty
11034                version - ie substr($name, 1, 1) = $buffer; */
11035             sv_insert(name, 1, 1, buffer, 2);
11036         }
11037     }
11038     else {
11039         U32 unused;
11040         CV * const cv = find_runcv(&unused);
11041         SV *sv;
11042         AV *av;
11043
11044         if (!cv || !CvPADLIST(cv))
11045             return Nullsv;
11046         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11047         sv = *av_fetch(av, targ, FALSE);
11048         /* SvLEN in a pad name is not to be trusted */
11049         sv_setpv(name, SvPV_nolen_const(sv));
11050     }
11051
11052     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11053         SV * const sv = NEWSV(0,0);
11054         *SvPVX(name) = '$';
11055         Perl_sv_catpvf(aTHX_ name, "{%s}",
11056             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11057         SvREFCNT_dec(sv);
11058     }
11059     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11060         *SvPVX(name) = '$';
11061         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11062     }
11063     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11064         sv_insert(name, 0, 0,  "within ", 7);
11065
11066     return name;
11067 }
11068
11069
11070 /*
11071 =for apidoc find_uninit_var
11072
11073 Find the name of the undefined variable (if any) that caused the operator o
11074 to issue a "Use of uninitialized value" warning.
11075 If match is true, only return a name if it's value matches uninit_sv.
11076 So roughly speaking, if a unary operator (such as OP_COS) generates a
11077 warning, then following the direct child of the op may yield an
11078 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11079 other hand, with OP_ADD there are two branches to follow, so we only print
11080 the variable name if we get an exact match.
11081
11082 The name is returned as a mortal SV.
11083
11084 Assumes that PL_op is the op that originally triggered the error, and that
11085 PL_comppad/PL_curpad points to the currently executing pad.
11086
11087 =cut
11088 */
11089
11090 STATIC SV *
11091 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11092 {
11093     dVAR;
11094     SV *sv;
11095     AV *av;
11096     GV *gv;
11097     OP *o, *o2, *kid;
11098
11099     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11100                             uninit_sv == &PL_sv_placeholder)))
11101         return Nullsv;
11102
11103     switch (obase->op_type) {
11104
11105     case OP_RV2AV:
11106     case OP_RV2HV:
11107     case OP_PADAV:
11108     case OP_PADHV:
11109       {
11110         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11111         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11112         I32 index = 0;
11113         SV *keysv = Nullsv;
11114         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11115
11116         if (pad) { /* @lex, %lex */
11117             sv = PAD_SVl(obase->op_targ);
11118             gv = Nullgv;
11119         }
11120         else {
11121             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11122             /* @global, %global */
11123                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11124                 if (!gv)
11125                     break;
11126                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11127             }
11128             else /* @{expr}, %{expr} */
11129                 return find_uninit_var(cUNOPx(obase)->op_first,
11130                                                     uninit_sv, match);
11131         }
11132
11133         /* attempt to find a match within the aggregate */
11134         if (hash) {
11135             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11136             if (keysv)
11137                 subscript_type = FUV_SUBSCRIPT_HASH;
11138         }
11139         else {
11140             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11141             if (index >= 0)
11142                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11143         }
11144
11145         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11146             break;
11147
11148         return varname(gv, hash ? '%' : '@', obase->op_targ,
11149                                     keysv, index, subscript_type);
11150       }
11151
11152     case OP_PADSV:
11153         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11154             break;
11155         return varname(Nullgv, '$', obase->op_targ,
11156                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11157
11158     case OP_GVSV:
11159         gv = cGVOPx_gv(obase);
11160         if (!gv || (match && GvSV(gv) != uninit_sv))
11161             break;
11162         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11163
11164     case OP_AELEMFAST:
11165         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11166             if (match) {
11167                 SV **svp;
11168                 av = (AV*)PAD_SV(obase->op_targ);
11169                 if (!av || SvRMAGICAL(av))
11170                     break;
11171                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11172                 if (!svp || *svp != uninit_sv)
11173                     break;
11174             }
11175             return varname(Nullgv, '$', obase->op_targ,
11176                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11177         }
11178         else {
11179             gv = cGVOPx_gv(obase);
11180             if (!gv)
11181                 break;
11182             if (match) {
11183                 SV **svp;
11184                 av = GvAV(gv);
11185                 if (!av || SvRMAGICAL(av))
11186                     break;
11187                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11188                 if (!svp || *svp != uninit_sv)
11189                     break;
11190             }
11191             return varname(gv, '$', 0,
11192                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11193         }
11194         break;
11195
11196     case OP_EXISTS:
11197         o = cUNOPx(obase)->op_first;
11198         if (!o || o->op_type != OP_NULL ||
11199                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11200             break;
11201         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11202
11203     case OP_AELEM:
11204     case OP_HELEM:
11205         if (PL_op == obase)
11206             /* $a[uninit_expr] or $h{uninit_expr} */
11207             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11208
11209         gv = Nullgv;
11210         o = cBINOPx(obase)->op_first;
11211         kid = cBINOPx(obase)->op_last;
11212
11213         /* get the av or hv, and optionally the gv */
11214         sv = Nullsv;
11215         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11216             sv = PAD_SV(o->op_targ);
11217         }
11218         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11219                 && cUNOPo->op_first->op_type == OP_GV)
11220         {
11221             gv = cGVOPx_gv(cUNOPo->op_first);
11222             if (!gv)
11223                 break;
11224             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11225         }
11226         if (!sv)
11227             break;
11228
11229         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11230             /* index is constant */
11231             if (match) {
11232                 if (SvMAGICAL(sv))
11233                     break;
11234                 if (obase->op_type == OP_HELEM) {
11235                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11236                     if (!he || HeVAL(he) != uninit_sv)
11237                         break;
11238                 }
11239                 else {
11240                     SV * const * const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11241                     if (!svp || *svp != uninit_sv)
11242                         break;
11243                 }
11244             }
11245             if (obase->op_type == OP_HELEM)
11246                 return varname(gv, '%', o->op_targ,
11247                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11248             else
11249                 return varname(gv, '@', o->op_targ, Nullsv,
11250                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11251         }
11252         else  {
11253             /* index is an expression;
11254              * attempt to find a match within the aggregate */
11255             if (obase->op_type == OP_HELEM) {
11256                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11257                 if (keysv)
11258                     return varname(gv, '%', o->op_targ,
11259                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11260             }
11261             else {
11262                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11263                 if (index >= 0)
11264                     return varname(gv, '@', o->op_targ,
11265                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11266             }
11267             if (match)
11268                 break;
11269             return varname(gv,
11270                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11271                 ? '@' : '%',
11272                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11273         }
11274
11275         break;
11276
11277     case OP_AASSIGN:
11278         /* only examine RHS */
11279         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11280
11281     case OP_OPEN:
11282         o = cUNOPx(obase)->op_first;
11283         if (o->op_type == OP_PUSHMARK)
11284             o = o->op_sibling;
11285
11286         if (!o->op_sibling) {
11287             /* one-arg version of open is highly magical */
11288
11289             if (o->op_type == OP_GV) { /* open FOO; */
11290                 gv = cGVOPx_gv(o);
11291                 if (match && GvSV(gv) != uninit_sv)
11292                     break;
11293                 return varname(gv, '$', 0,
11294                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11295             }
11296             /* other possibilities not handled are:
11297              * open $x; or open my $x;  should return '${*$x}'
11298              * open expr;               should return '$'.expr ideally
11299              */
11300              break;
11301         }
11302         goto do_op;
11303
11304     /* ops where $_ may be an implicit arg */
11305     case OP_TRANS:
11306     case OP_SUBST:
11307     case OP_MATCH:
11308         if ( !(obase->op_flags & OPf_STACKED)) {
11309             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11310                                  ? PAD_SVl(obase->op_targ)
11311                                  : DEFSV))
11312             {
11313                 sv = sv_newmortal();
11314                 sv_setpvn(sv, "$_", 2);
11315                 return sv;
11316             }
11317         }
11318         goto do_op;
11319
11320     case OP_PRTF:
11321     case OP_PRINT:
11322         /* skip filehandle as it can't produce 'undef' warning  */
11323         o = cUNOPx(obase)->op_first;
11324         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11325             o = o->op_sibling->op_sibling;
11326         goto do_op2;
11327
11328
11329     case OP_RV2SV:
11330     case OP_CUSTOM:
11331     case OP_ENTERSUB:
11332         match = 1; /* XS or custom code could trigger random warnings */
11333         goto do_op;
11334
11335     case OP_SCHOMP:
11336     case OP_CHOMP:
11337         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11338             return sv_2mortal(newSVpvn("${$/}", 5));
11339         /* FALL THROUGH */
11340
11341     default:
11342     do_op:
11343         if (!(obase->op_flags & OPf_KIDS))
11344             break;
11345         o = cUNOPx(obase)->op_first;
11346         
11347     do_op2:
11348         if (!o)
11349             break;
11350
11351         /* if all except one arg are constant, or have no side-effects,
11352          * or are optimized away, then it's unambiguous */
11353         o2 = Nullop;
11354         for (kid=o; kid; kid = kid->op_sibling) {
11355             if (kid &&
11356                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11357                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11358                   || (kid->op_type == OP_PUSHMARK)
11359                 )
11360             )
11361                 continue;
11362             if (o2) { /* more than one found */
11363                 o2 = Nullop;
11364                 break;
11365             }
11366             o2 = kid;
11367         }
11368         if (o2)
11369             return find_uninit_var(o2, uninit_sv, match);
11370
11371         /* scan all args */
11372         while (o) {
11373             sv = find_uninit_var(o, uninit_sv, 1);
11374             if (sv)
11375                 return sv;
11376             o = o->op_sibling;
11377         }
11378         break;
11379     }
11380     return Nullsv;
11381 }
11382
11383
11384 /*
11385 =for apidoc report_uninit
11386
11387 Print appropriate "Use of uninitialized variable" warning
11388
11389 =cut
11390 */
11391
11392 void
11393 Perl_report_uninit(pTHX_ SV* uninit_sv)
11394 {
11395     if (PL_op) {
11396         SV* varname = Nullsv;
11397         if (uninit_sv) {
11398             varname = find_uninit_var(PL_op, uninit_sv,0);
11399             if (varname)
11400                 sv_insert(varname, 0, 0, " ", 1);
11401         }
11402         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11403                 varname ? SvPV_nolen_const(varname) : "",
11404                 " in ", OP_DESC(PL_op));
11405     }
11406     else
11407         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11408                     "", "", "");
11409 }
11410
11411 /*
11412  * Local variables:
11413  * c-indentation-style: bsd
11414  * c-basic-offset: 4
11415  * indent-tabs-mode: t
11416  * End:
11417  *
11418  * ex: set ts=8 sts=4 sw=4 noet:
11419  */