8ba8eb0ff9fc17809f9bf75700415f79b08690e3
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* const sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = Nullav;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void ** const arena_root    = &PL_body_arenaroots[sv_type];
644     void ** const root          = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void ** const r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void ** const thing_copy = (void **)thing;\
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      + relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
813      - relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      + relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
819      - relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      + relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
835      - relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      + relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
841      - relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s = SvPVX_const(sv);
1417           const char * const end = s + SvCUR(sv);
1418           for ( ; s < end && d < limit; s++ ) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 STATIC bool
1629 S_sv_2iuv_common(pTHX_ SV *sv) {
1630     if (SvNOKp(sv)) {
1631         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1632          * without also getting a cached IV/UV from it at the same time
1633          * (ie PV->NV conversion should detect loss of accuracy and cache
1634          * IV or UV at same time to avoid this. */
1635         /* IV-over-UV optimisation - choose to cache IV if possible */
1636
1637         if (SvTYPE(sv) == SVt_NV)
1638             sv_upgrade(sv, SVt_PVNV);
1639
1640         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1641         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1642            certainly cast into the IV range at IV_MAX, whereas the correct
1643            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1644            cases go to UV */
1645         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1646             SvIV_set(sv, I_V(SvNVX(sv)));
1647             if (SvNVX(sv) == (NV) SvIVX(sv)
1648 #ifndef NV_PRESERVES_UV
1649                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1650                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1651                 /* Don't flag it as "accurately an integer" if the number
1652                    came from a (by definition imprecise) NV operation, and
1653                    we're outside the range of NV integer precision */
1654 #endif
1655                 ) {
1656                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1657                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1658                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1659                                       PTR2UV(sv),
1660                                       SvNVX(sv),
1661                                       SvIVX(sv)));
1662
1663             } else {
1664                 /* IV not precise.  No need to convert from PV, as NV
1665                    conversion would already have cached IV if it detected
1666                    that PV->IV would be better than PV->NV->IV
1667                    flags already correct - don't set public IOK.  */
1668                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1669                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1670                                       PTR2UV(sv),
1671                                       SvNVX(sv),
1672                                       SvIVX(sv)));
1673             }
1674             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1675                but the cast (NV)IV_MIN rounds to a the value less (more
1676                negative) than IV_MIN which happens to be equal to SvNVX ??
1677                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1678                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1679                (NV)UVX == NVX are both true, but the values differ. :-(
1680                Hopefully for 2s complement IV_MIN is something like
1681                0x8000000000000000 which will be exact. NWC */
1682         }
1683         else {
1684             SvUV_set(sv, U_V(SvNVX(sv)));
1685             if (
1686                 (SvNVX(sv) == (NV) SvUVX(sv))
1687 #ifndef  NV_PRESERVES_UV
1688                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1689                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1690                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1691                 /* Don't flag it as "accurately an integer" if the number
1692                    came from a (by definition imprecise) NV operation, and
1693                    we're outside the range of NV integer precision */
1694 #endif
1695                 )
1696                 SvIOK_on(sv);
1697             SvIsUV_on(sv);
1698             DEBUG_c(PerlIO_printf(Perl_debug_log,
1699                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1700                                   PTR2UV(sv),
1701                                   SvUVX(sv),
1702                                   SvUVX(sv)));
1703         }
1704     }
1705     else if (SvPOKp(sv) && SvLEN(sv)) {
1706         UV value;
1707         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1708         /* We want to avoid a possible problem when we cache an IV/ a UV which
1709            may be later translated to an NV, and the resulting NV is not
1710            the same as the direct translation of the initial string
1711            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1712            be careful to ensure that the value with the .456 is around if the
1713            NV value is requested in the future).
1714         
1715            This means that if we cache such an IV/a UV, we need to cache the
1716            NV as well.  Moreover, we trade speed for space, and do not
1717            cache the NV if we are sure it's not needed.
1718          */
1719
1720         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1721         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1722              == IS_NUMBER_IN_UV) {
1723             /* It's definitely an integer, only upgrade to PVIV */
1724             if (SvTYPE(sv) < SVt_PVIV)
1725                 sv_upgrade(sv, SVt_PVIV);
1726             (void)SvIOK_on(sv);
1727         } else if (SvTYPE(sv) < SVt_PVNV)
1728             sv_upgrade(sv, SVt_PVNV);
1729
1730         /* If NV preserves UV then we only use the UV value if we know that
1731            we aren't going to call atof() below. If NVs don't preserve UVs
1732            then the value returned may have more precision than atof() will
1733            return, even though value isn't perfectly accurate.  */
1734         if ((numtype & (IS_NUMBER_IN_UV
1735 #ifdef NV_PRESERVES_UV
1736                         | IS_NUMBER_NOT_INT
1737 #endif
1738             )) == IS_NUMBER_IN_UV) {
1739             /* This won't turn off the public IOK flag if it was set above  */
1740             (void)SvIOKp_on(sv);
1741
1742             if (!(numtype & IS_NUMBER_NEG)) {
1743                 /* positive */;
1744                 if (value <= (UV)IV_MAX) {
1745                     SvIV_set(sv, (IV)value);
1746                 } else {
1747                     /* it didn't overflow, and it was positive. */
1748                     SvUV_set(sv, value);
1749                     SvIsUV_on(sv);
1750                 }
1751             } else {
1752                 /* 2s complement assumption  */
1753                 if (value <= (UV)IV_MIN) {
1754                     SvIV_set(sv, -(IV)value);
1755                 } else {
1756                     /* Too negative for an IV.  This is a double upgrade, but
1757                        I'm assuming it will be rare.  */
1758                     if (SvTYPE(sv) < SVt_PVNV)
1759                         sv_upgrade(sv, SVt_PVNV);
1760                     SvNOK_on(sv);
1761                     SvIOK_off(sv);
1762                     SvIOKp_on(sv);
1763                     SvNV_set(sv, -(NV)value);
1764                     SvIV_set(sv, IV_MIN);
1765                 }
1766             }
1767         }
1768         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1769            will be in the previous block to set the IV slot, and the next
1770            block to set the NV slot.  So no else here.  */
1771         
1772         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1773             != IS_NUMBER_IN_UV) {
1774             /* It wasn't an (integer that doesn't overflow the UV). */
1775             SvNV_set(sv, Atof(SvPVX_const(sv)));
1776
1777             if (! numtype && ckWARN(WARN_NUMERIC))
1778                 not_a_number(sv);
1779
1780 #if defined(USE_LONG_DOUBLE)
1781             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1782                                   PTR2UV(sv), SvNVX(sv)));
1783 #else
1784             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1785                                   PTR2UV(sv), SvNVX(sv)));
1786 #endif
1787
1788 #ifdef NV_PRESERVES_UV
1789             (void)SvIOKp_on(sv);
1790             (void)SvNOK_on(sv);
1791             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1792                 SvIV_set(sv, I_V(SvNVX(sv)));
1793                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1794                     SvIOK_on(sv);
1795                 } else {
1796                     /* Integer is imprecise. NOK, IOKp */
1797                 }
1798                 /* UV will not work better than IV */
1799             } else {
1800                 if (SvNVX(sv) > (NV)UV_MAX) {
1801                     SvIsUV_on(sv);
1802                     /* Integer is inaccurate. NOK, IOKp, is UV */
1803                     SvUV_set(sv, UV_MAX);
1804                 } else {
1805                     SvUV_set(sv, U_V(SvNVX(sv)));
1806                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
1807                        NV preservse UV so can do correct comparison.  */
1808                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1809                         SvIOK_on(sv);
1810                     } else {
1811                         /* Integer is imprecise. NOK, IOKp, is UV */
1812                     }
1813                 }
1814                 SvIsUV_on(sv);
1815             }
1816 #else /* NV_PRESERVES_UV */
1817             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1818                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1819                 /* The IV/UV slot will have been set from value returned by
1820                    grok_number above.  The NV slot has just been set using
1821                    Atof.  */
1822                 SvNOK_on(sv);
1823                 assert (SvIOKp(sv));
1824             } else {
1825                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1826                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1827                     /* Small enough to preserve all bits. */
1828                     (void)SvIOKp_on(sv);
1829                     SvNOK_on(sv);
1830                     SvIV_set(sv, I_V(SvNVX(sv)));
1831                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1832                         SvIOK_on(sv);
1833                     /* Assumption: first non-preserved integer is < IV_MAX,
1834                        this NV is in the preserved range, therefore: */
1835                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1836                           < (UV)IV_MAX)) {
1837                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1838                     }
1839                 } else {
1840                     /* IN_UV NOT_INT
1841                          0      0       already failed to read UV.
1842                          0      1       already failed to read UV.
1843                          1      0       you won't get here in this case. IV/UV
1844                                         slot set, public IOK, Atof() unneeded.
1845                          1      1       already read UV.
1846                        so there's no point in sv_2iuv_non_preserve() attempting
1847                        to use atol, strtol, strtoul etc.  */
1848                     sv_2iuv_non_preserve (sv, numtype);
1849                 }
1850             }
1851 #endif /* NV_PRESERVES_UV */
1852         }
1853     }
1854     else  {
1855         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1856             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1857                 report_uninit(sv);
1858         }
1859         if (SvTYPE(sv) < SVt_IV)
1860             /* Typically the caller expects that sv_any is not NULL now.  */
1861             sv_upgrade(sv, SVt_IV);
1862         /* Return 0 from the caller.  */
1863         return TRUE;
1864     }
1865     return FALSE;
1866 }
1867
1868 /*
1869 =for apidoc sv_2iv_flags
1870
1871 Return the integer value of an SV, doing any necessary string
1872 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1873 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1874
1875 =cut
1876 */
1877
1878 IV
1879 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1880 {
1881     if (!sv)
1882         return 0;
1883     if (SvGMAGICAL(sv)) {
1884         if (flags & SV_GMAGIC)
1885             mg_get(sv);
1886         if (SvIOKp(sv))
1887             return SvIVX(sv);
1888         if (SvNOKp(sv)) {
1889             return I_V(SvNVX(sv));
1890         }
1891         if (SvPOKp(sv) && SvLEN(sv)) {
1892             UV value;
1893             const int numtype
1894                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1895
1896             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1897                 == IS_NUMBER_IN_UV) {
1898                 /* It's definitely an integer */
1899                 if (numtype & IS_NUMBER_NEG) {
1900                     if (value < (UV)IV_MIN)
1901                         return -(IV)value;
1902                 } else {
1903                     if (value < (UV)IV_MAX)
1904                         return (IV)value;
1905                 }
1906             }
1907             if (!numtype) {
1908                 if (ckWARN(WARN_NUMERIC))
1909                     not_a_number(sv);
1910             }
1911             return I_V(Atof(SvPVX_const(sv)));
1912         }
1913         if (!SvROK(sv)) {
1914             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1915                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1916                     report_uninit(sv);
1917             }
1918             return 0;
1919         }
1920         /* Else this will drop through into the SvROK case just below, which
1921            will return within the {} for all code paths.  */
1922     }
1923     if (SvTHINKFIRST(sv)) {
1924         if (SvROK(sv)) {
1925             if (SvAMAGIC(sv)) {
1926                 SV * const tmpstr=AMG_CALLun(sv,numer);
1927                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1928                     return SvIV(tmpstr);
1929                 }
1930             }
1931             return PTR2IV(SvRV(sv));
1932         }
1933         if (SvIsCOW(sv)) {
1934             sv_force_normal_flags(sv, 0);
1935         }
1936         if (SvREADONLY(sv) && !SvOK(sv)) {
1937             if (ckWARN(WARN_UNINITIALIZED))
1938                 report_uninit(sv);
1939             return 0;
1940         }
1941     }
1942     if (!SvIOKp(sv)) {
1943         if (S_sv_2iuv_common(aTHX_ sv))
1944             return 0;
1945     }
1946     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1947         PTR2UV(sv),SvIVX(sv)));
1948     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1949 }
1950
1951 /*
1952 =for apidoc sv_2uv_flags
1953
1954 Return the unsigned integer value of an SV, doing any necessary string
1955 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1956 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1957
1958 =cut
1959 */
1960
1961 UV
1962 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1963 {
1964     if (!sv)
1965         return 0;
1966     if (SvGMAGICAL(sv)) {
1967         if (flags & SV_GMAGIC)
1968             mg_get(sv);
1969         if (SvIOKp(sv))
1970             return SvUVX(sv);
1971         if (SvNOKp(sv))
1972             return U_V(SvNVX(sv));
1973         if (SvPOKp(sv) && SvLEN(sv)) {
1974             UV value;
1975             const int numtype
1976                 = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1977
1978             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1979                 == IS_NUMBER_IN_UV) {
1980                 /* It's definitely an integer */
1981                 if (!(numtype & IS_NUMBER_NEG))
1982                     return value;
1983             }
1984             if (!numtype) {
1985                 if (ckWARN(WARN_NUMERIC))
1986                     not_a_number(sv);
1987             }
1988             return U_V(Atof(SvPVX_const(sv)));
1989         }
1990         if (!SvROK(sv)) {
1991             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1992                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1993                     report_uninit(sv);
1994             }
1995             return 0;
1996         }
1997         /* Else this will drop through into the SvROK case just below, which
1998            will return within the {} for all code paths.  */
1999     }
2000     if (SvTHINKFIRST(sv)) {
2001         if (SvROK(sv)) {
2002           SV* tmpstr;
2003           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2004                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2005               return SvUV(tmpstr);
2006           return PTR2UV(SvRV(sv));
2007         }
2008         if (SvIsCOW(sv)) {
2009             sv_force_normal_flags(sv, 0);
2010         }
2011         if (SvREADONLY(sv) && !SvOK(sv)) {
2012             if (ckWARN(WARN_UNINITIALIZED))
2013                 report_uninit(sv);
2014             return 0;
2015         }
2016     }
2017     if (!SvIOKp(sv)) {
2018         if (S_sv_2iuv_common(aTHX_ sv))
2019             return 0;
2020     }
2021
2022     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
2023                           PTR2UV(sv),SvUVX(sv)));
2024     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
2025 }
2026
2027 /*
2028 =for apidoc sv_2nv
2029
2030 Return the num value of an SV, doing any necessary string or integer
2031 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
2032 macros.
2033
2034 =cut
2035 */
2036
2037 NV
2038 Perl_sv_2nv(pTHX_ register SV *sv)
2039 {
2040     if (!sv)
2041         return 0.0;
2042     if (SvGMAGICAL(sv)) {
2043         mg_get(sv);
2044         if (SvNOKp(sv))
2045             return SvNVX(sv);
2046         if (SvPOKp(sv) && SvLEN(sv)) {
2047             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2048                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2049                 not_a_number(sv);
2050             return Atof(SvPVX_const(sv));
2051         }
2052         if (SvIOKp(sv)) {
2053             if (SvIsUV(sv))
2054                 return (NV)SvUVX(sv);
2055             else
2056                 return (NV)SvIVX(sv);
2057         }
2058         if (SvROK(sv)) {
2059             goto return_rok;
2060         }
2061         assert(SvTYPE(sv) >= SVt_PVMG);
2062         /* This falls through to the report_uninit near the end of the
2063            function. */
2064     } else if (SvTHINKFIRST(sv)) {
2065         if (SvROK(sv)) {
2066           SV* tmpstr;
2067         return_rok:
2068           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2069                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2070               return SvNV(tmpstr);
2071           return PTR2NV(SvRV(sv));
2072         }
2073         if (SvIsCOW(sv)) {
2074             sv_force_normal_flags(sv, 0);
2075         }
2076         if (SvREADONLY(sv) && !SvOK(sv)) {
2077             if (ckWARN(WARN_UNINITIALIZED))
2078                 report_uninit(sv);
2079             return 0.0;
2080         }
2081     }
2082     if (SvTYPE(sv) < SVt_NV) {
2083         /* The logic to use SVt_PVNV if necessary is in sv_upgrade.  */
2084         sv_upgrade(sv, SVt_NV);
2085 #ifdef USE_LONG_DOUBLE
2086         DEBUG_c({
2087             STORE_NUMERIC_LOCAL_SET_STANDARD();
2088             PerlIO_printf(Perl_debug_log,
2089                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2090                           PTR2UV(sv), SvNVX(sv));
2091             RESTORE_NUMERIC_LOCAL();
2092         });
2093 #else
2094         DEBUG_c({
2095             STORE_NUMERIC_LOCAL_SET_STANDARD();
2096             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2097                           PTR2UV(sv), SvNVX(sv));
2098             RESTORE_NUMERIC_LOCAL();
2099         });
2100 #endif
2101     }
2102     else if (SvTYPE(sv) < SVt_PVNV)
2103         sv_upgrade(sv, SVt_PVNV);
2104     if (SvNOKp(sv)) {
2105         return SvNVX(sv);
2106     }
2107     if (SvIOKp(sv)) {
2108         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2109 #ifdef NV_PRESERVES_UV
2110         SvNOK_on(sv);
2111 #else
2112         /* Only set the public NV OK flag if this NV preserves the IV  */
2113         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2114         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2115                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2116             SvNOK_on(sv);
2117         else
2118             SvNOKp_on(sv);
2119 #endif
2120     }
2121     else if (SvPOKp(sv) && SvLEN(sv)) {
2122         UV value;
2123         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2124         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2125             not_a_number(sv);
2126 #ifdef NV_PRESERVES_UV
2127         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2128             == IS_NUMBER_IN_UV) {
2129             /* It's definitely an integer */
2130             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2131         } else
2132             SvNV_set(sv, Atof(SvPVX_const(sv)));
2133         SvNOK_on(sv);
2134 #else
2135         SvNV_set(sv, Atof(SvPVX_const(sv)));
2136         /* Only set the public NV OK flag if this NV preserves the value in
2137            the PV at least as well as an IV/UV would.
2138            Not sure how to do this 100% reliably. */
2139         /* if that shift count is out of range then Configure's test is
2140            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2141            UV_BITS */
2142         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2143             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2144             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2145         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2146             /* Can't use strtol etc to convert this string, so don't try.
2147                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2148             SvNOK_on(sv);
2149         } else {
2150             /* value has been set.  It may not be precise.  */
2151             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2152                 /* 2s complement assumption for (UV)IV_MIN  */
2153                 SvNOK_on(sv); /* Integer is too negative.  */
2154             } else {
2155                 SvNOKp_on(sv);
2156                 SvIOKp_on(sv);
2157
2158                 if (numtype & IS_NUMBER_NEG) {
2159                     SvIV_set(sv, -(IV)value);
2160                 } else if (value <= (UV)IV_MAX) {
2161                     SvIV_set(sv, (IV)value);
2162                 } else {
2163                     SvUV_set(sv, value);
2164                     SvIsUV_on(sv);
2165                 }
2166
2167                 if (numtype & IS_NUMBER_NOT_INT) {
2168                     /* I believe that even if the original PV had decimals,
2169                        they are lost beyond the limit of the FP precision.
2170                        However, neither is canonical, so both only get p
2171                        flags.  NWC, 2000/11/25 */
2172                     /* Both already have p flags, so do nothing */
2173                 } else {
2174                     const NV nv = SvNVX(sv);
2175                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2176                         if (SvIVX(sv) == I_V(nv)) {
2177                             SvNOK_on(sv);
2178                         } else {
2179                             /* It had no "." so it must be integer.  */
2180                         }
2181                         SvIOK_on(sv);
2182                     } else {
2183                         /* between IV_MAX and NV(UV_MAX).
2184                            Could be slightly > UV_MAX */
2185
2186                         if (numtype & IS_NUMBER_NOT_INT) {
2187                             /* UV and NV both imprecise.  */
2188                         } else {
2189                             const UV nv_as_uv = U_V(nv);
2190
2191                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2192                                 SvNOK_on(sv);
2193                             }
2194                             SvIOK_on(sv);
2195                         }
2196                     }
2197                 }
2198             }
2199         }
2200 #endif /* NV_PRESERVES_UV */
2201     }
2202     else  {
2203         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2204             report_uninit(sv);
2205         assert (SvTYPE(sv) >= SVt_NV);
2206         /* Typically the caller expects that sv_any is not NULL now.  */
2207         /* XXX Ilya implies that this is a bug in callers that assume this
2208            and ideally should be fixed.  */
2209         return 0.0;
2210     }
2211 #if defined(USE_LONG_DOUBLE)
2212     DEBUG_c({
2213         STORE_NUMERIC_LOCAL_SET_STANDARD();
2214         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2215                       PTR2UV(sv), SvNVX(sv));
2216         RESTORE_NUMERIC_LOCAL();
2217     });
2218 #else
2219     DEBUG_c({
2220         STORE_NUMERIC_LOCAL_SET_STANDARD();
2221         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2222                       PTR2UV(sv), SvNVX(sv));
2223         RESTORE_NUMERIC_LOCAL();
2224     });
2225 #endif
2226     return SvNVX(sv);
2227 }
2228
2229 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2230  * UV as a string towards the end of buf, and return pointers to start and
2231  * end of it.
2232  *
2233  * We assume that buf is at least TYPE_CHARS(UV) long.
2234  */
2235
2236 static char *
2237 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2238 {
2239     char *ptr = buf + TYPE_CHARS(UV);
2240     char * const ebuf = ptr;
2241     int sign;
2242
2243     if (is_uv)
2244         sign = 0;
2245     else if (iv >= 0) {
2246         uv = iv;
2247         sign = 0;
2248     } else {
2249         uv = -iv;
2250         sign = 1;
2251     }
2252     do {
2253         *--ptr = '0' + (char)(uv % 10);
2254     } while (uv /= 10);
2255     if (sign)
2256         *--ptr = '-';
2257     *peob = ebuf;
2258     return ptr;
2259 }
2260
2261 /* stringify_regexp(): private routine for use by sv_2pv_flags(): converts
2262  * a regexp to its stringified form.
2263  */
2264
2265 static char *
2266 S_stringify_regexp(pTHX_ SV *sv, MAGIC *mg, STRLEN *lp) {
2267     const regexp * const re = (regexp *)mg->mg_obj;
2268
2269     if (!mg->mg_ptr) {
2270         const char *fptr = "msix";
2271         char reflags[6];
2272         char ch;
2273         int left = 0;
2274         int right = 4;
2275         bool need_newline = 0;
2276         U16 reganch = (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2277
2278         while((ch = *fptr++)) {
2279             if(reganch & 1) {
2280                 reflags[left++] = ch;
2281             }
2282             else {
2283                 reflags[right--] = ch;
2284             }
2285             reganch >>= 1;
2286         }
2287         if(left != 4) {
2288             reflags[left] = '-';
2289             left = 5;
2290         }
2291
2292         mg->mg_len = re->prelen + 4 + left;
2293         /*
2294          * If /x was used, we have to worry about a regex ending with a
2295          * comment later being embedded within another regex. If so, we don't
2296          * want this regex's "commentization" to leak out to the right part of
2297          * the enclosing regex, we must cap it with a newline.
2298          *
2299          * So, if /x was used, we scan backwards from the end of the regex. If
2300          * we find a '#' before we find a newline, we need to add a newline
2301          * ourself. If we find a '\n' first (or if we don't find '#' or '\n'),
2302          * we don't need to add anything.  -jfriedl
2303          */
2304         if (PMf_EXTENDED & re->reganch) {
2305             const char *endptr = re->precomp + re->prelen;
2306             while (endptr >= re->precomp) {
2307                 const char c = *(endptr--);
2308                 if (c == '\n')
2309                     break; /* don't need another */
2310                 if (c == '#') {
2311                     /* we end while in a comment, so we need a newline */
2312                     mg->mg_len++; /* save space for it */
2313                     need_newline = 1; /* note to add it */
2314                     break;
2315                 }
2316             }
2317         }
2318
2319         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2320         mg->mg_ptr[0] = '(';
2321         mg->mg_ptr[1] = '?';
2322         Copy(reflags, mg->mg_ptr+2, left, char);
2323         *(mg->mg_ptr+left+2) = ':';
2324         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2325         if (need_newline)
2326             mg->mg_ptr[mg->mg_len - 2] = '\n';
2327         mg->mg_ptr[mg->mg_len - 1] = ')';
2328         mg->mg_ptr[mg->mg_len] = 0;
2329     }
2330     PL_reginterp_cnt += re->program[0].next_off;
2331     
2332     if (re->reganch & ROPT_UTF8)
2333         SvUTF8_on(sv);
2334     else
2335         SvUTF8_off(sv);
2336     if (lp)
2337         *lp = mg->mg_len;
2338     return mg->mg_ptr;
2339 }
2340
2341 /*
2342 =for apidoc sv_2pv_flags
2343
2344 Returns a pointer to the string value of an SV, and sets *lp to its length.
2345 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2346 if necessary.
2347 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2348 usually end up here too.
2349
2350 =cut
2351 */
2352
2353 char *
2354 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2355 {
2356     register char *s;
2357     int olderrno;
2358
2359     if (!sv) {
2360         if (lp)
2361             *lp = 0;
2362         return (char *)"";
2363     }
2364     if (SvGMAGICAL(sv)) {
2365         if (flags & SV_GMAGIC)
2366             mg_get(sv);
2367         if (SvPOKp(sv)) {
2368             if (lp)
2369                 *lp = SvCUR(sv);
2370             if (flags & SV_MUTABLE_RETURN)
2371                 return SvPVX_mutable(sv);
2372             if (flags & SV_CONST_RETURN)
2373                 return (char *)SvPVX_const(sv);
2374             return SvPVX(sv);
2375         }
2376         if (SvIOKp(sv) || SvNOKp(sv)) {
2377             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2378             STRLEN len;
2379
2380             if (SvIOKp(sv)) {
2381                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2382                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2383             } else {
2384                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2385                 len = strlen(tbuf);
2386             }
2387             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2388                 /* Sneaky stuff here */
2389                 SV * const tsv = newSVpvn(tbuf, len);
2390
2391                 sv_2mortal(tsv);
2392                 if (lp)
2393                     *lp = SvCUR(tsv);
2394                 return SvPVX(tsv);
2395             }
2396             else {
2397                 dVAR;
2398
2399 #ifdef FIXNEGATIVEZERO
2400                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2401                     tbuf[0] = '0';
2402                     tbuf[1] = 0;
2403                     len = 1;
2404                 }
2405 #endif
2406                 SvUPGRADE(sv, SVt_PV);
2407                 if (lp)
2408                     *lp = len;
2409                 s = SvGROW_mutable(sv, len + 1);
2410                 SvCUR_set(sv, len);
2411                 SvPOKp_on(sv);
2412                 return memcpy(s, tbuf, len + 1);
2413             }
2414         }
2415         if (!SvROK(sv)) {
2416             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2417                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2418                     report_uninit(sv);
2419             }
2420             if (lp)
2421                 *lp = 0;
2422             return (char *)"";
2423         }
2424         /* Else this will drop through into the SvROK case just below, which
2425            will return within the {} for all code paths.  */
2426     }
2427     if (SvTHINKFIRST(sv)) {
2428         if (SvROK(sv)) {
2429             SV* tmpstr;
2430
2431             if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,string)) &&
2432                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2433                 /* Unwrap this:  */
2434                 /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr); */
2435
2436                 char *pv;
2437                 if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2438                     if (flags & SV_CONST_RETURN) {
2439                         pv = (char *) SvPVX_const(tmpstr);
2440                     } else {
2441                         pv = (flags & SV_MUTABLE_RETURN)
2442                             ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2443                     }
2444                     if (lp)
2445                         *lp = SvCUR(tmpstr);
2446                 } else {
2447                     pv = sv_2pv_flags(tmpstr, lp, flags);
2448                 }
2449                 if (SvUTF8(tmpstr))
2450                     SvUTF8_on(sv);
2451                 else
2452                     SvUTF8_off(sv);
2453                 return pv;
2454             } else {
2455                 SV *tsv;
2456                 MAGIC *mg;
2457                 const SV *const referent = (SV*)SvRV(sv);
2458
2459                 if (!referent) {
2460                     tsv = sv_2mortal(newSVpvn("NULLREF", 7));
2461                 } else if (SvTYPE(referent) == SVt_PVMG
2462                            && ((SvFLAGS(referent) &
2463                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2464                                == (SVs_OBJECT|SVs_SMG))
2465                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2466                     return S_stringify_regexp(aTHX_ sv, mg, lp);
2467                 } else {
2468                     const char *const typestr = sv_reftype(referent, 0);
2469
2470                     tsv = sv_newmortal();
2471                     if (SvOBJECT(referent)) {
2472                         const char *const name = HvNAME_get(SvSTASH(referent));
2473                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2474                                        name ? name : "__ANON__" , typestr,
2475                                        PTR2UV(referent));
2476                     }
2477                     else
2478                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2479                                        PTR2UV(referent));
2480                 }
2481                 if (lp)
2482                     *lp = SvCUR(tsv);
2483                 return SvPVX(tsv);
2484             }
2485         }
2486         if (SvREADONLY(sv) && !SvOK(sv)) {
2487             if (ckWARN(WARN_UNINITIALIZED))
2488                 report_uninit(sv);
2489             if (lp)
2490                 *lp = 0;
2491             return (char *)"";
2492         }
2493     }
2494     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2495         /* I'm assuming that if both IV and NV are equally valid then
2496            converting the IV is going to be more efficient */
2497         const U32 isIOK = SvIOK(sv);
2498         const U32 isUIOK = SvIsUV(sv);
2499         char buf[TYPE_CHARS(UV)];
2500         char *ebuf, *ptr;
2501
2502         if (SvTYPE(sv) < SVt_PVIV)
2503             sv_upgrade(sv, SVt_PVIV);
2504         if (isUIOK)
2505             ptr = uiv_2buf(buf, 0, SvUVX(sv), 1, &ebuf);
2506         else
2507             ptr = uiv_2buf(buf, SvIVX(sv), 0, 0, &ebuf);
2508         /* inlined from sv_setpvn */
2509         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2510         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2511         SvCUR_set(sv, ebuf - ptr);
2512         s = SvEND(sv);
2513         *s = '\0';
2514         if (isIOK)
2515             SvIOK_on(sv);
2516         else
2517             SvIOKp_on(sv);
2518         if (isUIOK)
2519             SvIsUV_on(sv);
2520     }
2521     else if (SvNOKp(sv)) {
2522         if (SvTYPE(sv) < SVt_PVNV)
2523             sv_upgrade(sv, SVt_PVNV);
2524         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2525         s = SvGROW_mutable(sv, NV_DIG + 20);
2526         olderrno = errno;       /* some Xenix systems wipe out errno here */
2527 #ifdef apollo
2528         if (SvNVX(sv) == 0.0)
2529             (void)strcpy(s,"0");
2530         else
2531 #endif /*apollo*/
2532         {
2533             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2534         }
2535         errno = olderrno;
2536 #ifdef FIXNEGATIVEZERO
2537         if (*s == '-' && s[1] == '0' && !s[2])
2538             strcpy(s,"0");
2539 #endif
2540         while (*s) s++;
2541 #ifdef hcx
2542         if (s[-1] == '.')
2543             *--s = '\0';
2544 #endif
2545     }
2546     else {
2547         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2548             report_uninit(sv);
2549         if (lp)
2550             *lp = 0;
2551         if (SvTYPE(sv) < SVt_PV)
2552             /* Typically the caller expects that sv_any is not NULL now.  */
2553             sv_upgrade(sv, SVt_PV);
2554         return (char *)"";
2555     }
2556     {
2557         const STRLEN len = s - SvPVX_const(sv);
2558         if (lp) 
2559             *lp = len;
2560         SvCUR_set(sv, len);
2561     }
2562     SvPOK_on(sv);
2563     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2564                           PTR2UV(sv),SvPVX_const(sv)));
2565     if (flags & SV_CONST_RETURN)
2566         return (char *)SvPVX_const(sv);
2567     if (flags & SV_MUTABLE_RETURN)
2568         return SvPVX_mutable(sv);
2569     return SvPVX(sv);
2570 }
2571
2572 /*
2573 =for apidoc sv_copypv
2574
2575 Copies a stringified representation of the source SV into the
2576 destination SV.  Automatically performs any necessary mg_get and
2577 coercion of numeric values into strings.  Guaranteed to preserve
2578 UTF-8 flag even from overloaded objects.  Similar in nature to
2579 sv_2pv[_flags] but operates directly on an SV instead of just the
2580 string.  Mostly uses sv_2pv_flags to do its work, except when that
2581 would lose the UTF-8'ness of the PV.
2582
2583 =cut
2584 */
2585
2586 void
2587 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2588 {
2589     STRLEN len;
2590     const char * const s = SvPV_const(ssv,len);
2591     sv_setpvn(dsv,s,len);
2592     if (SvUTF8(ssv))
2593         SvUTF8_on(dsv);
2594     else
2595         SvUTF8_off(dsv);
2596 }
2597
2598 /*
2599 =for apidoc sv_2pvbyte
2600
2601 Return a pointer to the byte-encoded representation of the SV, and set *lp
2602 to its length.  May cause the SV to be downgraded from UTF-8 as a
2603 side-effect.
2604
2605 Usually accessed via the C<SvPVbyte> macro.
2606
2607 =cut
2608 */
2609
2610 char *
2611 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2612 {
2613     sv_utf8_downgrade(sv,0);
2614     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2615 }
2616
2617 /*
2618 =for apidoc sv_2pvutf8
2619
2620 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2621 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2622
2623 Usually accessed via the C<SvPVutf8> macro.
2624
2625 =cut
2626 */
2627
2628 char *
2629 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2630 {
2631     sv_utf8_upgrade(sv);
2632     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2633 }
2634
2635
2636 /*
2637 =for apidoc sv_2bool
2638
2639 This function is only called on magical items, and is only used by
2640 sv_true() or its macro equivalent.
2641
2642 =cut
2643 */
2644
2645 bool
2646 Perl_sv_2bool(pTHX_ register SV *sv)
2647 {
2648     SvGETMAGIC(sv);
2649
2650     if (!SvOK(sv))
2651         return 0;
2652     if (SvROK(sv)) {
2653         SV* tmpsv;
2654         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2655                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2656             return (bool)SvTRUE(tmpsv);
2657       return SvRV(sv) != 0;
2658     }
2659     if (SvPOKp(sv)) {
2660         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2661         if (Xpvtmp &&
2662                 (*sv->sv_u.svu_pv > '0' ||
2663                 Xpvtmp->xpv_cur > 1 ||
2664                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2665             return 1;
2666         else
2667             return 0;
2668     }
2669     else {
2670         if (SvIOKp(sv))
2671             return SvIVX(sv) != 0;
2672         else {
2673             if (SvNOKp(sv))
2674                 return SvNVX(sv) != 0.0;
2675             else
2676                 return FALSE;
2677         }
2678     }
2679 }
2680
2681 /*
2682 =for apidoc sv_utf8_upgrade
2683
2684 Converts the PV of an SV to its UTF-8-encoded form.
2685 Forces the SV to string form if it is not already.
2686 Always sets the SvUTF8 flag to avoid future validity checks even
2687 if all the bytes have hibit clear.
2688
2689 This is not as a general purpose byte encoding to Unicode interface:
2690 use the Encode extension for that.
2691
2692 =for apidoc sv_utf8_upgrade_flags
2693
2694 Converts the PV of an SV to its UTF-8-encoded form.
2695 Forces the SV to string form if it is not already.
2696 Always sets the SvUTF8 flag to avoid future validity checks even
2697 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2698 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2699 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2700
2701 This is not as a general purpose byte encoding to Unicode interface:
2702 use the Encode extension for that.
2703
2704 =cut
2705 */
2706
2707 STRLEN
2708 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2709 {
2710     if (sv == &PL_sv_undef)
2711         return 0;
2712     if (!SvPOK(sv)) {
2713         STRLEN len = 0;
2714         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2715             (void) sv_2pv_flags(sv,&len, flags);
2716             if (SvUTF8(sv))
2717                 return len;
2718         } else {
2719             (void) SvPV_force(sv,len);
2720         }
2721     }
2722
2723     if (SvUTF8(sv)) {
2724         return SvCUR(sv);
2725     }
2726
2727     if (SvIsCOW(sv)) {
2728         sv_force_normal_flags(sv, 0);
2729     }
2730
2731     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2732         sv_recode_to_utf8(sv, PL_encoding);
2733     else { /* Assume Latin-1/EBCDIC */
2734         /* This function could be much more efficient if we
2735          * had a FLAG in SVs to signal if there are any hibit
2736          * chars in the PV.  Given that there isn't such a flag
2737          * make the loop as fast as possible. */
2738         const U8 * const s = (U8 *) SvPVX_const(sv);
2739         const U8 * const e = (U8 *) SvEND(sv);
2740         const U8 *t = s;
2741         
2742         while (t < e) {
2743             const U8 ch = *t++;
2744             /* Check for hi bit */
2745             if (!NATIVE_IS_INVARIANT(ch)) {
2746                 STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2747                 U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2748
2749                 SvPV_free(sv); /* No longer using what was there before. */
2750                 SvPV_set(sv, (char*)recoded);
2751                 SvCUR_set(sv, len - 1);
2752                 SvLEN_set(sv, len); /* No longer know the real size. */
2753                 break;
2754             }
2755         }
2756         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2757         SvUTF8_on(sv);
2758     }
2759     return SvCUR(sv);
2760 }
2761
2762 /*
2763 =for apidoc sv_utf8_downgrade
2764
2765 Attempts to convert the PV of an SV from characters to bytes.
2766 If the PV contains a character beyond byte, this conversion will fail;
2767 in this case, either returns false or, if C<fail_ok> is not
2768 true, croaks.
2769
2770 This is not as a general purpose Unicode to byte encoding interface:
2771 use the Encode extension for that.
2772
2773 =cut
2774 */
2775
2776 bool
2777 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
2778 {
2779     if (SvPOKp(sv) && SvUTF8(sv)) {
2780         if (SvCUR(sv)) {
2781             U8 *s;
2782             STRLEN len;
2783
2784             if (SvIsCOW(sv)) {
2785                 sv_force_normal_flags(sv, 0);
2786             }
2787             s = (U8 *) SvPV(sv, len);
2788             if (!utf8_to_bytes(s, &len)) {
2789                 if (fail_ok)
2790                     return FALSE;
2791                 else {
2792                     if (PL_op)
2793                         Perl_croak(aTHX_ "Wide character in %s",
2794                                    OP_DESC(PL_op));
2795                     else
2796                         Perl_croak(aTHX_ "Wide character");
2797                 }
2798             }
2799             SvCUR_set(sv, len);
2800         }
2801     }
2802     SvUTF8_off(sv);
2803     return TRUE;
2804 }
2805
2806 /*
2807 =for apidoc sv_utf8_encode
2808
2809 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
2810 flag off so that it looks like octets again.
2811
2812 =cut
2813 */
2814
2815 void
2816 Perl_sv_utf8_encode(pTHX_ register SV *sv)
2817 {
2818     (void) sv_utf8_upgrade(sv);
2819     if (SvIsCOW(sv)) {
2820         sv_force_normal_flags(sv, 0);
2821     }
2822     if (SvREADONLY(sv)) {
2823         Perl_croak(aTHX_ PL_no_modify);
2824     }
2825     SvUTF8_off(sv);
2826 }
2827
2828 /*
2829 =for apidoc sv_utf8_decode
2830
2831 If the PV of the SV is an octet sequence in UTF-8
2832 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
2833 so that it looks like a character. If the PV contains only single-byte
2834 characters, the C<SvUTF8> flag stays being off.
2835 Scans PV for validity and returns false if the PV is invalid UTF-8.
2836
2837 =cut
2838 */
2839
2840 bool
2841 Perl_sv_utf8_decode(pTHX_ register SV *sv)
2842 {
2843     if (SvPOKp(sv)) {
2844         const U8 *c;
2845         const U8 *e;
2846
2847         /* The octets may have got themselves encoded - get them back as
2848          * bytes
2849          */
2850         if (!sv_utf8_downgrade(sv, TRUE))
2851             return FALSE;
2852
2853         /* it is actually just a matter of turning the utf8 flag on, but
2854          * we want to make sure everything inside is valid utf8 first.
2855          */
2856         c = (const U8 *) SvPVX_const(sv);
2857         if (!is_utf8_string(c, SvCUR(sv)+1))
2858             return FALSE;
2859         e = (const U8 *) SvEND(sv);
2860         while (c < e) {
2861             const U8 ch = *c++;
2862             if (!UTF8_IS_INVARIANT(ch)) {
2863                 SvUTF8_on(sv);
2864                 break;
2865             }
2866         }
2867     }
2868     return TRUE;
2869 }
2870
2871 /*
2872 =for apidoc sv_setsv
2873
2874 Copies the contents of the source SV C<ssv> into the destination SV
2875 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2876 function if the source SV needs to be reused. Does not handle 'set' magic.
2877 Loosely speaking, it performs a copy-by-value, obliterating any previous
2878 content of the destination.
2879
2880 You probably want to use one of the assortment of wrappers, such as
2881 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2882 C<SvSetMagicSV_nosteal>.
2883
2884 =for apidoc sv_setsv_flags
2885
2886 Copies the contents of the source SV C<ssv> into the destination SV
2887 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2888 function if the source SV needs to be reused. Does not handle 'set' magic.
2889 Loosely speaking, it performs a copy-by-value, obliterating any previous
2890 content of the destination.
2891 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
2892 C<ssv> if appropriate, else not. If the C<flags> parameter has the
2893 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
2894 and C<sv_setsv_nomg> are implemented in terms of this function.
2895
2896 You probably want to use one of the assortment of wrappers, such as
2897 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2898 C<SvSetMagicSV_nosteal>.
2899
2900 This is the primary function for copying scalars, and most other
2901 copy-ish functions and macros use this underneath.
2902
2903 =cut
2904 */
2905
2906 void
2907 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
2908 {
2909     register U32 sflags;
2910     register int dtype;
2911     register int stype;
2912
2913     if (sstr == dstr)
2914         return;
2915     SV_CHECK_THINKFIRST_COW_DROP(dstr);
2916     if (!sstr)
2917         sstr = &PL_sv_undef;
2918     stype = SvTYPE(sstr);
2919     dtype = SvTYPE(dstr);
2920
2921     SvAMAGIC_off(dstr);
2922     if ( SvVOK(dstr) )
2923     {
2924         /* need to nuke the magic */
2925         mg_free(dstr);
2926         SvRMAGICAL_off(dstr);
2927     }
2928
2929     /* There's a lot of redundancy below but we're going for speed here */
2930
2931     switch (stype) {
2932     case SVt_NULL:
2933       undef_sstr:
2934         if (dtype != SVt_PVGV) {
2935             (void)SvOK_off(dstr);
2936             return;
2937         }
2938         break;
2939     case SVt_IV:
2940         if (SvIOK(sstr)) {
2941             switch (dtype) {
2942             case SVt_NULL:
2943                 sv_upgrade(dstr, SVt_IV);
2944                 break;
2945             case SVt_NV:
2946                 sv_upgrade(dstr, SVt_PVNV);
2947                 break;
2948             case SVt_RV:
2949             case SVt_PV:
2950                 sv_upgrade(dstr, SVt_PVIV);
2951                 break;
2952             }
2953             (void)SvIOK_only(dstr);
2954             SvIV_set(dstr,  SvIVX(sstr));
2955             if (SvIsUV(sstr))
2956                 SvIsUV_on(dstr);
2957             if (SvTAINTED(sstr))
2958                 SvTAINT(dstr);
2959             return;
2960         }
2961         goto undef_sstr;
2962
2963     case SVt_NV:
2964         if (SvNOK(sstr)) {
2965             switch (dtype) {
2966             case SVt_NULL:
2967             case SVt_IV:
2968                 sv_upgrade(dstr, SVt_NV);
2969                 break;
2970             case SVt_RV:
2971             case SVt_PV:
2972             case SVt_PVIV:
2973                 sv_upgrade(dstr, SVt_PVNV);
2974                 break;
2975             }
2976             SvNV_set(dstr, SvNVX(sstr));
2977             (void)SvNOK_only(dstr);
2978             if (SvTAINTED(sstr))
2979                 SvTAINT(dstr);
2980             return;
2981         }
2982         goto undef_sstr;
2983
2984     case SVt_RV:
2985         if (dtype < SVt_RV)
2986             sv_upgrade(dstr, SVt_RV);
2987         else if (dtype == SVt_PVGV &&
2988                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
2989             sstr = SvRV(sstr);
2990             if (sstr == dstr) {
2991                 if (GvIMPORTED(dstr) != GVf_IMPORTED
2992                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
2993                 {
2994                     GvIMPORTED_on(dstr);
2995                 }
2996                 GvMULTI_on(dstr);
2997                 return;
2998             }
2999             goto glob_assign;
3000         }
3001         break;
3002     case SVt_PVFM:
3003 #ifdef PERL_OLD_COPY_ON_WRITE
3004         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3005             if (dtype < SVt_PVIV)
3006                 sv_upgrade(dstr, SVt_PVIV);
3007             break;
3008         }
3009         /* Fall through */
3010 #endif
3011     case SVt_PV:
3012         if (dtype < SVt_PV)
3013             sv_upgrade(dstr, SVt_PV);
3014         break;
3015     case SVt_PVIV:
3016         if (dtype < SVt_PVIV)
3017             sv_upgrade(dstr, SVt_PVIV);
3018         break;
3019     case SVt_PVNV:
3020         if (dtype < SVt_PVNV)
3021             sv_upgrade(dstr, SVt_PVNV);
3022         break;
3023     case SVt_PVAV:
3024     case SVt_PVHV:
3025     case SVt_PVCV:
3026     case SVt_PVIO:
3027         {
3028         const char * const type = sv_reftype(sstr,0);
3029         if (PL_op)
3030             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3031         else
3032             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3033         }
3034         break;
3035
3036     case SVt_PVGV:
3037         if (dtype <= SVt_PVGV) {
3038   glob_assign:
3039             if (dtype != SVt_PVGV) {
3040                 const char * const name = GvNAME(sstr);
3041                 const STRLEN len = GvNAMELEN(sstr);
3042                 /* don't upgrade SVt_PVLV: it can hold a glob */
3043                 if (dtype != SVt_PVLV)
3044                     sv_upgrade(dstr, SVt_PVGV);
3045                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3046                 GvSTASH(dstr) = GvSTASH(sstr);
3047                 if (GvSTASH(dstr))
3048                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3049                 GvNAME(dstr) = savepvn(name, len);
3050                 GvNAMELEN(dstr) = len;
3051                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3052             }
3053
3054 #ifdef GV_UNIQUE_CHECK
3055                 if (GvUNIQUE((GV*)dstr)) {
3056                     Perl_croak(aTHX_ PL_no_modify);
3057                 }
3058 #endif
3059
3060             (void)SvOK_off(dstr);
3061             GvINTRO_off(dstr);          /* one-shot flag */
3062             gp_free((GV*)dstr);
3063             GvGP(dstr) = gp_ref(GvGP(sstr));
3064             if (SvTAINTED(sstr))
3065                 SvTAINT(dstr);
3066             if (GvIMPORTED(dstr) != GVf_IMPORTED
3067                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3068             {
3069                 GvIMPORTED_on(dstr);
3070             }
3071             GvMULTI_on(dstr);
3072             return;
3073         }
3074         /* FALL THROUGH */
3075
3076     default:
3077         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3078             mg_get(sstr);
3079             if ((int)SvTYPE(sstr) != stype) {
3080                 stype = SvTYPE(sstr);
3081                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3082                     goto glob_assign;
3083             }
3084         }
3085         if (stype == SVt_PVLV)
3086             SvUPGRADE(dstr, SVt_PVNV);
3087         else
3088             SvUPGRADE(dstr, (U32)stype);
3089     }
3090
3091     sflags = SvFLAGS(sstr);
3092
3093     if (sflags & SVf_ROK) {
3094         if (dtype >= SVt_PV) {
3095             if (dtype == SVt_PVGV) {
3096                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3097                 SV *dref = 0;
3098                 const int intro = GvINTRO(dstr);
3099
3100 #ifdef GV_UNIQUE_CHECK
3101                 if (GvUNIQUE((GV*)dstr)) {
3102                     Perl_croak(aTHX_ PL_no_modify);
3103                 }
3104 #endif
3105
3106                 if (intro) {
3107                     GvINTRO_off(dstr);  /* one-shot flag */
3108                     GvLINE(dstr) = CopLINE(PL_curcop);
3109                     GvEGV(dstr) = (GV*)dstr;
3110                 }
3111                 GvMULTI_on(dstr);
3112                 switch (SvTYPE(sref)) {
3113                 case SVt_PVAV:
3114                     if (intro)
3115                         SAVEGENERICSV(GvAV(dstr));
3116                     else
3117                         dref = (SV*)GvAV(dstr);
3118                     GvAV(dstr) = (AV*)sref;
3119                     if (!GvIMPORTED_AV(dstr)
3120                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3121                     {
3122                         GvIMPORTED_AV_on(dstr);
3123                     }
3124                     break;
3125                 case SVt_PVHV:
3126                     if (intro)
3127                         SAVEGENERICSV(GvHV(dstr));
3128                     else
3129                         dref = (SV*)GvHV(dstr);
3130                     GvHV(dstr) = (HV*)sref;
3131                     if (!GvIMPORTED_HV(dstr)
3132                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3133                     {
3134                         GvIMPORTED_HV_on(dstr);
3135                     }
3136                     break;
3137                 case SVt_PVCV:
3138                     if (intro) {
3139                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3140                             SvREFCNT_dec(GvCV(dstr));
3141                             GvCV(dstr) = Nullcv;
3142                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3143                             PL_sub_generation++;
3144                         }
3145                         SAVEGENERICSV(GvCV(dstr));
3146                     }
3147                     else
3148                         dref = (SV*)GvCV(dstr);
3149                     if (GvCV(dstr) != (CV*)sref) {
3150                         CV* const cv = GvCV(dstr);
3151                         if (cv) {
3152                             if (!GvCVGEN((GV*)dstr) &&
3153                                 (CvROOT(cv) || CvXSUB(cv)))
3154                             {
3155                                 /* Redefining a sub - warning is mandatory if
3156                                    it was a const and its value changed. */
3157                                 if (ckWARN(WARN_REDEFINE)
3158                                     || (CvCONST(cv)
3159                                         && (!CvCONST((CV*)sref)
3160                                             || sv_cmp(cv_const_sv(cv),
3161                                                       cv_const_sv((CV*)sref)))))
3162                                 {
3163                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3164                                         CvCONST(cv)
3165                                         ? "Constant subroutine %s::%s redefined"
3166                                         : "Subroutine %s::%s redefined",
3167                                         HvNAME_get(GvSTASH((GV*)dstr)),
3168                                         GvENAME((GV*)dstr));
3169                                 }
3170                             }
3171                             if (!intro)
3172                                 cv_ckproto(cv, (GV*)dstr,
3173                                            SvPOK(sref)
3174                                            ? SvPVX_const(sref) : Nullch);
3175                         }
3176                         GvCV(dstr) = (CV*)sref;
3177                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3178                         GvASSUMECV_on(dstr);
3179                         PL_sub_generation++;
3180                     }
3181                     if (!GvIMPORTED_CV(dstr)
3182                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3183                     {
3184                         GvIMPORTED_CV_on(dstr);
3185                     }
3186                     break;
3187                 case SVt_PVIO:
3188                     if (intro)
3189                         SAVEGENERICSV(GvIOp(dstr));
3190                     else
3191                         dref = (SV*)GvIOp(dstr);
3192                     GvIOp(dstr) = (IO*)sref;
3193                     break;
3194                 case SVt_PVFM:
3195                     if (intro)
3196                         SAVEGENERICSV(GvFORM(dstr));
3197                     else
3198                         dref = (SV*)GvFORM(dstr);
3199                     GvFORM(dstr) = (CV*)sref;
3200                     break;
3201                 default:
3202                     if (intro)
3203                         SAVEGENERICSV(GvSV(dstr));
3204                     else
3205                         dref = (SV*)GvSV(dstr);
3206                     GvSV(dstr) = sref;
3207                     if (!GvIMPORTED_SV(dstr)
3208                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3209                     {
3210                         GvIMPORTED_SV_on(dstr);
3211                     }
3212                     break;
3213                 }
3214                 if (dref)
3215                     SvREFCNT_dec(dref);
3216                 if (SvTAINTED(sstr))
3217                     SvTAINT(dstr);
3218                 return;
3219             }
3220             if (SvPVX_const(dstr)) {
3221                 SvPV_free(dstr);
3222                 SvLEN_set(dstr, 0);
3223                 SvCUR_set(dstr, 0);
3224             }
3225         }
3226         (void)SvOK_off(dstr);
3227         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3228         SvROK_on(dstr);
3229         if (sflags & SVp_NOK) {
3230             SvNOKp_on(dstr);
3231             /* Only set the public OK flag if the source has public OK.  */
3232             if (sflags & SVf_NOK)
3233                 SvFLAGS(dstr) |= SVf_NOK;
3234             SvNV_set(dstr, SvNVX(sstr));
3235         }
3236         if (sflags & SVp_IOK) {
3237             (void)SvIOKp_on(dstr);
3238             if (sflags & SVf_IOK)
3239                 SvFLAGS(dstr) |= SVf_IOK;
3240             if (sflags & SVf_IVisUV)
3241                 SvIsUV_on(dstr);
3242             SvIV_set(dstr, SvIVX(sstr));
3243         }
3244         if (SvAMAGIC(sstr)) {
3245             SvAMAGIC_on(dstr);
3246         }
3247     }
3248     else if (sflags & SVp_POK) {
3249         bool isSwipe = 0;
3250
3251         /*
3252          * Check to see if we can just swipe the string.  If so, it's a
3253          * possible small lose on short strings, but a big win on long ones.
3254          * It might even be a win on short strings if SvPVX_const(dstr)
3255          * has to be allocated and SvPVX_const(sstr) has to be freed.
3256          */
3257
3258         /* Whichever path we take through the next code, we want this true,
3259            and doing it now facilitates the COW check.  */
3260         (void)SvPOK_only(dstr);
3261
3262         if (
3263             /* We're not already COW  */
3264             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3265 #ifndef PERL_OLD_COPY_ON_WRITE
3266              /* or we are, but dstr isn't a suitable target.  */
3267              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3268 #endif
3269              )
3270             &&
3271             !(isSwipe =
3272                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3273                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3274                  (!(flags & SV_NOSTEAL)) &&
3275                                         /* and we're allowed to steal temps */
3276                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3277                  SvLEN(sstr)    &&        /* and really is a string */
3278                                 /* and won't be needed again, potentially */
3279               !(PL_op && PL_op->op_type == OP_AASSIGN))
3280 #ifdef PERL_OLD_COPY_ON_WRITE
3281             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3282                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3283                  && SvTYPE(sstr) >= SVt_PVIV)
3284 #endif
3285             ) {
3286             /* Failed the swipe test, and it's not a shared hash key either.
3287                Have to copy the string.  */
3288             STRLEN len = SvCUR(sstr);
3289             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3290             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3291             SvCUR_set(dstr, len);
3292             *SvEND(dstr) = '\0';
3293         } else {
3294             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3295                be true in here.  */
3296             /* Either it's a shared hash key, or it's suitable for
3297                copy-on-write or we can swipe the string.  */
3298             if (DEBUG_C_TEST) {
3299                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3300                 sv_dump(sstr);
3301                 sv_dump(dstr);
3302             }
3303 #ifdef PERL_OLD_COPY_ON_WRITE
3304             if (!isSwipe) {
3305                 /* I believe I should acquire a global SV mutex if
3306                    it's a COW sv (not a shared hash key) to stop
3307                    it going un copy-on-write.
3308                    If the source SV has gone un copy on write between up there
3309                    and down here, then (assert() that) it is of the correct
3310                    form to make it copy on write again */
3311                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3312                     != (SVf_FAKE | SVf_READONLY)) {
3313                     SvREADONLY_on(sstr);
3314                     SvFAKE_on(sstr);
3315                     /* Make the source SV into a loop of 1.
3316                        (about to become 2) */
3317                     SV_COW_NEXT_SV_SET(sstr, sstr);
3318                 }
3319             }
3320 #endif
3321             /* Initial code is common.  */
3322             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3323                 SvPV_free(dstr);
3324             }
3325
3326             if (!isSwipe) {
3327                 /* making another shared SV.  */
3328                 STRLEN cur = SvCUR(sstr);
3329                 STRLEN len = SvLEN(sstr);
3330 #ifdef PERL_OLD_COPY_ON_WRITE
3331                 if (len) {
3332                     assert (SvTYPE(dstr) >= SVt_PVIV);
3333                     /* SvIsCOW_normal */
3334                     /* splice us in between source and next-after-source.  */
3335                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3336                     SV_COW_NEXT_SV_SET(sstr, dstr);
3337                     SvPV_set(dstr, SvPVX_mutable(sstr));
3338                 } else
3339 #endif
3340                 {
3341                     /* SvIsCOW_shared_hash */
3342                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3343                                           "Copy on write: Sharing hash\n"));
3344
3345                     assert (SvTYPE(dstr) >= SVt_PV);
3346                     SvPV_set(dstr,
3347                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3348                 }
3349                 SvLEN_set(dstr, len);
3350                 SvCUR_set(dstr, cur);
3351                 SvREADONLY_on(dstr);
3352                 SvFAKE_on(dstr);
3353                 /* Relesase a global SV mutex.  */
3354             }
3355             else
3356                 {       /* Passes the swipe test.  */
3357                 SvPV_set(dstr, SvPVX_mutable(sstr));
3358                 SvLEN_set(dstr, SvLEN(sstr));
3359                 SvCUR_set(dstr, SvCUR(sstr));
3360
3361                 SvTEMP_off(dstr);
3362                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3363                 SvPV_set(sstr, Nullch);
3364                 SvLEN_set(sstr, 0);
3365                 SvCUR_set(sstr, 0);
3366                 SvTEMP_off(sstr);
3367             }
3368         }
3369         if (sflags & SVf_UTF8)
3370             SvUTF8_on(dstr);
3371         if (sflags & SVp_NOK) {
3372             SvNOKp_on(dstr);
3373             if (sflags & SVf_NOK)
3374                 SvFLAGS(dstr) |= SVf_NOK;
3375             SvNV_set(dstr, SvNVX(sstr));
3376         }
3377         if (sflags & SVp_IOK) {
3378             (void)SvIOKp_on(dstr);
3379             if (sflags & SVf_IOK)
3380                 SvFLAGS(dstr) |= SVf_IOK;
3381             if (sflags & SVf_IVisUV)
3382                 SvIsUV_on(dstr);
3383             SvIV_set(dstr, SvIVX(sstr));
3384         }
3385         if (SvVOK(sstr)) {
3386             const MAGIC * const smg = mg_find(sstr,PERL_MAGIC_vstring);
3387             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3388                         smg->mg_ptr, smg->mg_len);
3389             SvRMAGICAL_on(dstr);
3390         }
3391     }
3392     else if (sflags & SVp_IOK) {
3393         if (sflags & SVf_IOK)
3394             (void)SvIOK_only(dstr);
3395         else {
3396             (void)SvOK_off(dstr);
3397             (void)SvIOKp_on(dstr);
3398         }
3399         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3400         if (sflags & SVf_IVisUV)
3401             SvIsUV_on(dstr);
3402         SvIV_set(dstr, SvIVX(sstr));
3403         if (sflags & SVp_NOK) {
3404             if (sflags & SVf_NOK)
3405                 (void)SvNOK_on(dstr);
3406             else
3407                 (void)SvNOKp_on(dstr);
3408             SvNV_set(dstr, SvNVX(sstr));
3409         }
3410     }
3411     else if (sflags & SVp_NOK) {
3412         if (sflags & SVf_NOK)
3413             (void)SvNOK_only(dstr);
3414         else {
3415             (void)SvOK_off(dstr);
3416             SvNOKp_on(dstr);
3417         }
3418         SvNV_set(dstr, SvNVX(sstr));
3419     }
3420     else {
3421         if (dtype == SVt_PVGV) {
3422             if (ckWARN(WARN_MISC))
3423                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3424         }
3425         else
3426             (void)SvOK_off(dstr);
3427     }
3428     if (SvTAINTED(sstr))
3429         SvTAINT(dstr);
3430 }
3431
3432 /*
3433 =for apidoc sv_setsv_mg
3434
3435 Like C<sv_setsv>, but also handles 'set' magic.
3436
3437 =cut
3438 */
3439
3440 void
3441 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3442 {
3443     sv_setsv(dstr,sstr);
3444     SvSETMAGIC(dstr);
3445 }
3446
3447 #ifdef PERL_OLD_COPY_ON_WRITE
3448 SV *
3449 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3450 {
3451     STRLEN cur = SvCUR(sstr);
3452     STRLEN len = SvLEN(sstr);
3453     register char *new_pv;
3454
3455     if (DEBUG_C_TEST) {
3456         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3457                       sstr, dstr);
3458         sv_dump(sstr);
3459         if (dstr)
3460                     sv_dump(dstr);
3461     }
3462
3463     if (dstr) {
3464         if (SvTHINKFIRST(dstr))
3465             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3466         else if (SvPVX_const(dstr))
3467             Safefree(SvPVX_const(dstr));
3468     }
3469     else
3470         new_SV(dstr);
3471     SvUPGRADE(dstr, SVt_PVIV);
3472
3473     assert (SvPOK(sstr));
3474     assert (SvPOKp(sstr));
3475     assert (!SvIOK(sstr));
3476     assert (!SvIOKp(sstr));
3477     assert (!SvNOK(sstr));
3478     assert (!SvNOKp(sstr));
3479
3480     if (SvIsCOW(sstr)) {
3481
3482         if (SvLEN(sstr) == 0) {
3483             /* source is a COW shared hash key.  */
3484             DEBUG_C(PerlIO_printf(Perl_debug_log,
3485                                   "Fast copy on write: Sharing hash\n"));
3486             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3487             goto common_exit;
3488         }
3489         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3490     } else {
3491         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3492         SvUPGRADE(sstr, SVt_PVIV);
3493         SvREADONLY_on(sstr);
3494         SvFAKE_on(sstr);
3495         DEBUG_C(PerlIO_printf(Perl_debug_log,
3496                               "Fast copy on write: Converting sstr to COW\n"));
3497         SV_COW_NEXT_SV_SET(dstr, sstr);
3498     }
3499     SV_COW_NEXT_SV_SET(sstr, dstr);
3500     new_pv = SvPVX_mutable(sstr);
3501
3502   common_exit:
3503     SvPV_set(dstr, new_pv);
3504     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3505     if (SvUTF8(sstr))
3506         SvUTF8_on(dstr);
3507     SvLEN_set(dstr, len);
3508     SvCUR_set(dstr, cur);
3509     if (DEBUG_C_TEST) {
3510         sv_dump(dstr);
3511     }
3512     return dstr;
3513 }
3514 #endif
3515
3516 /*
3517 =for apidoc sv_setpvn
3518
3519 Copies a string into an SV.  The C<len> parameter indicates the number of
3520 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3521 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3522
3523 =cut
3524 */
3525
3526 void
3527 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3528 {
3529     register char *dptr;
3530
3531     SV_CHECK_THINKFIRST_COW_DROP(sv);
3532     if (!ptr) {
3533         (void)SvOK_off(sv);
3534         return;
3535     }
3536     else {
3537         /* len is STRLEN which is unsigned, need to copy to signed */
3538         const IV iv = len;
3539         if (iv < 0)
3540             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3541     }
3542     SvUPGRADE(sv, SVt_PV);
3543
3544     dptr = SvGROW(sv, len + 1);
3545     Move(ptr,dptr,len,char);
3546     dptr[len] = '\0';
3547     SvCUR_set(sv, len);
3548     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3549     SvTAINT(sv);
3550 }
3551
3552 /*
3553 =for apidoc sv_setpvn_mg
3554
3555 Like C<sv_setpvn>, but also handles 'set' magic.
3556
3557 =cut
3558 */
3559
3560 void
3561 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3562 {
3563     sv_setpvn(sv,ptr,len);
3564     SvSETMAGIC(sv);
3565 }
3566
3567 /*
3568 =for apidoc sv_setpv
3569
3570 Copies a string into an SV.  The string must be null-terminated.  Does not
3571 handle 'set' magic.  See C<sv_setpv_mg>.
3572
3573 =cut
3574 */
3575
3576 void
3577 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3578 {
3579     register STRLEN len;
3580
3581     SV_CHECK_THINKFIRST_COW_DROP(sv);
3582     if (!ptr) {
3583         (void)SvOK_off(sv);
3584         return;
3585     }
3586     len = strlen(ptr);
3587     SvUPGRADE(sv, SVt_PV);
3588
3589     SvGROW(sv, len + 1);
3590     Move(ptr,SvPVX(sv),len+1,char);
3591     SvCUR_set(sv, len);
3592     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3593     SvTAINT(sv);
3594 }
3595
3596 /*
3597 =for apidoc sv_setpv_mg
3598
3599 Like C<sv_setpv>, but also handles 'set' magic.
3600
3601 =cut
3602 */
3603
3604 void
3605 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3606 {
3607     sv_setpv(sv,ptr);
3608     SvSETMAGIC(sv);
3609 }
3610
3611 /*
3612 =for apidoc sv_usepvn
3613
3614 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3615 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3616 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3617 string length, C<len>, must be supplied.  This function will realloc the
3618 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3619 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3620 See C<sv_usepvn_mg>.
3621
3622 =cut
3623 */
3624
3625 void
3626 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3627 {
3628     STRLEN allocate;
3629     SV_CHECK_THINKFIRST_COW_DROP(sv);
3630     SvUPGRADE(sv, SVt_PV);
3631     if (!ptr) {
3632         (void)SvOK_off(sv);
3633         return;
3634     }
3635     if (SvPVX_const(sv))
3636         SvPV_free(sv);
3637
3638     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3639     ptr = saferealloc (ptr, allocate);
3640     SvPV_set(sv, ptr);
3641     SvCUR_set(sv, len);
3642     SvLEN_set(sv, allocate);
3643     *SvEND(sv) = '\0';
3644     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3645     SvTAINT(sv);
3646 }
3647
3648 /*
3649 =for apidoc sv_usepvn_mg
3650
3651 Like C<sv_usepvn>, but also handles 'set' magic.
3652
3653 =cut
3654 */
3655
3656 void
3657 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3658 {
3659     sv_usepvn(sv,ptr,len);
3660     SvSETMAGIC(sv);
3661 }
3662
3663 #ifdef PERL_OLD_COPY_ON_WRITE
3664 /* Need to do this *after* making the SV normal, as we need the buffer
3665    pointer to remain valid until after we've copied it.  If we let go too early,
3666    another thread could invalidate it by unsharing last of the same hash key
3667    (which it can do by means other than releasing copy-on-write Svs)
3668    or by changing the other copy-on-write SVs in the loop.  */
3669 STATIC void
3670 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3671 {
3672     if (len) { /* this SV was SvIsCOW_normal(sv) */
3673          /* we need to find the SV pointing to us.  */
3674         SV * const current = SV_COW_NEXT_SV(after);
3675
3676         if (current == sv) {
3677             /* The SV we point to points back to us (there were only two of us
3678                in the loop.)
3679                Hence other SV is no longer copy on write either.  */
3680             SvFAKE_off(after);
3681             SvREADONLY_off(after);
3682         } else {
3683             /* We need to follow the pointers around the loop.  */
3684             SV *next;
3685             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3686                 assert (next);
3687                 current = next;
3688                  /* don't loop forever if the structure is bust, and we have
3689                     a pointer into a closed loop.  */
3690                 assert (current != after);
3691                 assert (SvPVX_const(current) == pvx);
3692             }
3693             /* Make the SV before us point to the SV after us.  */
3694             SV_COW_NEXT_SV_SET(current, after);
3695         }
3696     } else {
3697         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3698     }
3699 }
3700
3701 int
3702 Perl_sv_release_IVX(pTHX_ register SV *sv)
3703 {
3704     if (SvIsCOW(sv))
3705         sv_force_normal_flags(sv, 0);
3706     SvOOK_off(sv);
3707     return 0;
3708 }
3709 #endif
3710 /*
3711 =for apidoc sv_force_normal_flags
3712
3713 Undo various types of fakery on an SV: if the PV is a shared string, make
3714 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3715 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3716 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3717 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3718 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3719 set to some other value.) In addition, the C<flags> parameter gets passed to
3720 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3721 with flags set to 0.
3722
3723 =cut
3724 */
3725
3726 void
3727 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3728 {
3729 #ifdef PERL_OLD_COPY_ON_WRITE
3730     if (SvREADONLY(sv)) {
3731         /* At this point I believe I should acquire a global SV mutex.  */
3732         if (SvFAKE(sv)) {
3733             const char * const pvx = SvPVX_const(sv);
3734             const STRLEN len = SvLEN(sv);
3735             const STRLEN cur = SvCUR(sv);
3736             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3737             if (DEBUG_C_TEST) {
3738                 PerlIO_printf(Perl_debug_log,
3739                               "Copy on write: Force normal %ld\n",
3740                               (long) flags);
3741                 sv_dump(sv);
3742             }
3743             SvFAKE_off(sv);
3744             SvREADONLY_off(sv);
3745             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3746             SvPV_set(sv, (char*)0);
3747             SvLEN_set(sv, 0);
3748             if (flags & SV_COW_DROP_PV) {
3749                 /* OK, so we don't need to copy our buffer.  */
3750                 SvPOK_off(sv);
3751             } else {
3752                 SvGROW(sv, cur + 1);
3753                 Move(pvx,SvPVX(sv),cur,char);
3754                 SvCUR_set(sv, cur);
3755                 *SvEND(sv) = '\0';
3756             }
3757             sv_release_COW(sv, pvx, len, next);
3758             if (DEBUG_C_TEST) {
3759                 sv_dump(sv);
3760             }
3761         }
3762         else if (IN_PERL_RUNTIME)
3763             Perl_croak(aTHX_ PL_no_modify);
3764         /* At this point I believe that I can drop the global SV mutex.  */
3765     }
3766 #else
3767     if (SvREADONLY(sv)) {
3768         if (SvFAKE(sv)) {
3769             const char * const pvx = SvPVX_const(sv);
3770             const STRLEN len = SvCUR(sv);
3771             SvFAKE_off(sv);
3772             SvREADONLY_off(sv);
3773             SvPV_set(sv, Nullch);
3774             SvLEN_set(sv, 0);
3775             SvGROW(sv, len + 1);
3776             Move(pvx,SvPVX(sv),len,char);
3777             *SvEND(sv) = '\0';
3778             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3779         }
3780         else if (IN_PERL_RUNTIME)
3781             Perl_croak(aTHX_ PL_no_modify);
3782     }
3783 #endif
3784     if (SvROK(sv))
3785         sv_unref_flags(sv, flags);
3786     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
3787         sv_unglob(sv);
3788 }
3789
3790 /*
3791 =for apidoc sv_chop
3792
3793 Efficient removal of characters from the beginning of the string buffer.
3794 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
3795 the string buffer.  The C<ptr> becomes the first character of the adjusted
3796 string. Uses the "OOK hack".
3797 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
3798 refer to the same chunk of data.
3799
3800 =cut
3801 */
3802
3803 void
3804 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
3805 {
3806     register STRLEN delta;
3807     if (!ptr || !SvPOKp(sv))
3808         return;
3809     delta = ptr - SvPVX_const(sv);
3810     SV_CHECK_THINKFIRST(sv);
3811     if (SvTYPE(sv) < SVt_PVIV)
3812         sv_upgrade(sv,SVt_PVIV);
3813
3814     if (!SvOOK(sv)) {
3815         if (!SvLEN(sv)) { /* make copy of shared string */
3816             const char *pvx = SvPVX_const(sv);
3817             const STRLEN len = SvCUR(sv);
3818             SvGROW(sv, len + 1);
3819             Move(pvx,SvPVX(sv),len,char);
3820             *SvEND(sv) = '\0';
3821         }
3822         SvIV_set(sv, 0);
3823         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
3824            and we do that anyway inside the SvNIOK_off
3825         */
3826         SvFLAGS(sv) |= SVf_OOK;
3827     }
3828     SvNIOK_off(sv);
3829     SvLEN_set(sv, SvLEN(sv) - delta);
3830     SvCUR_set(sv, SvCUR(sv) - delta);
3831     SvPV_set(sv, SvPVX(sv) + delta);
3832     SvIV_set(sv, SvIVX(sv) + delta);
3833 }
3834
3835 /*
3836 =for apidoc sv_catpvn
3837
3838 Concatenates the string onto the end of the string which is in the SV.  The
3839 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3840 status set, then the bytes appended should be valid UTF-8.
3841 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
3842
3843 =for apidoc sv_catpvn_flags
3844
3845 Concatenates the string onto the end of the string which is in the SV.  The
3846 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3847 status set, then the bytes appended should be valid UTF-8.
3848 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
3849 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
3850 in terms of this function.
3851
3852 =cut
3853 */
3854
3855 void
3856 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
3857 {
3858     STRLEN dlen;
3859     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
3860
3861     SvGROW(dsv, dlen + slen + 1);
3862     if (sstr == dstr)
3863         sstr = SvPVX_const(dsv);
3864     Move(sstr, SvPVX(dsv) + dlen, slen, char);
3865     SvCUR_set(dsv, SvCUR(dsv) + slen);
3866     *SvEND(dsv) = '\0';
3867     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
3868     SvTAINT(dsv);
3869     if (flags & SV_SMAGIC)
3870         SvSETMAGIC(dsv);
3871 }
3872
3873 /*
3874 =for apidoc sv_catsv
3875
3876 Concatenates the string from SV C<ssv> onto the end of the string in
3877 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
3878 not 'set' magic.  See C<sv_catsv_mg>.
3879
3880 =for apidoc sv_catsv_flags
3881
3882 Concatenates the string from SV C<ssv> onto the end of the string in
3883 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
3884 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
3885 and C<sv_catsv_nomg> are implemented in terms of this function.
3886
3887 =cut */
3888
3889 void
3890 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
3891 {
3892     if (ssv) {
3893         STRLEN slen;
3894         const char *spv = SvPV_const(ssv, slen);
3895         if (spv) {
3896             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
3897                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
3898                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
3899                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
3900                 dsv->sv_flags doesn't have that bit set.
3901                 Andy Dougherty  12 Oct 2001
3902             */
3903             const I32 sutf8 = DO_UTF8(ssv);
3904             I32 dutf8;
3905
3906             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
3907                 mg_get(dsv);
3908             dutf8 = DO_UTF8(dsv);
3909
3910             if (dutf8 != sutf8) {
3911                 if (dutf8) {
3912                     /* Not modifying source SV, so taking a temporary copy. */
3913                     SV* const csv = sv_2mortal(newSVpvn(spv, slen));
3914
3915                     sv_utf8_upgrade(csv);
3916                     spv = SvPV_const(csv, slen);
3917                 }
3918                 else
3919                     sv_utf8_upgrade_nomg(dsv);
3920             }
3921             sv_catpvn_nomg(dsv, spv, slen);
3922         }
3923     }
3924     if (flags & SV_SMAGIC)
3925         SvSETMAGIC(dsv);
3926 }
3927
3928 /*
3929 =for apidoc sv_catpv
3930
3931 Concatenates the string onto the end of the string which is in the SV.
3932 If the SV has the UTF-8 status set, then the bytes appended should be
3933 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
3934
3935 =cut */
3936
3937 void
3938 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
3939 {
3940     register STRLEN len;
3941     STRLEN tlen;
3942     char *junk;
3943
3944     if (!ptr)
3945         return;
3946     junk = SvPV_force(sv, tlen);
3947     len = strlen(ptr);
3948     SvGROW(sv, tlen + len + 1);
3949     if (ptr == junk)
3950         ptr = SvPVX_const(sv);
3951     Move(ptr,SvPVX(sv)+tlen,len+1,char);
3952     SvCUR_set(sv, SvCUR(sv) + len);
3953     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3954     SvTAINT(sv);
3955 }
3956
3957 /*
3958 =for apidoc sv_catpv_mg
3959
3960 Like C<sv_catpv>, but also handles 'set' magic.
3961
3962 =cut
3963 */
3964
3965 void
3966 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
3967 {
3968     sv_catpv(sv,ptr);
3969     SvSETMAGIC(sv);
3970 }
3971
3972 /*
3973 =for apidoc newSV
3974
3975 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
3976 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
3977 macro.
3978
3979 =cut
3980 */
3981
3982 SV *
3983 Perl_newSV(pTHX_ STRLEN len)
3984 {
3985     register SV *sv;
3986
3987     new_SV(sv);
3988     if (len) {
3989         sv_upgrade(sv, SVt_PV);
3990         SvGROW(sv, len + 1);
3991     }
3992     return sv;
3993 }
3994 /*
3995 =for apidoc sv_magicext
3996
3997 Adds magic to an SV, upgrading it if necessary. Applies the
3998 supplied vtable and returns a pointer to the magic added.
3999
4000 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4001 In particular, you can add magic to SvREADONLY SVs, and add more than
4002 one instance of the same 'how'.
4003
4004 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4005 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4006 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4007 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4008
4009 (This is now used as a subroutine by C<sv_magic>.)
4010
4011 =cut
4012 */
4013 MAGIC * 
4014 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4015                  const char* name, I32 namlen)
4016 {
4017     MAGIC* mg;
4018
4019     if (SvTYPE(sv) < SVt_PVMG) {
4020         SvUPGRADE(sv, SVt_PVMG);
4021     }
4022     Newxz(mg, 1, MAGIC);
4023     mg->mg_moremagic = SvMAGIC(sv);
4024     SvMAGIC_set(sv, mg);
4025
4026     /* Sometimes a magic contains a reference loop, where the sv and
4027        object refer to each other.  To prevent a reference loop that
4028        would prevent such objects being freed, we look for such loops
4029        and if we find one we avoid incrementing the object refcount.
4030
4031        Note we cannot do this to avoid self-tie loops as intervening RV must
4032        have its REFCNT incremented to keep it in existence.
4033
4034     */
4035     if (!obj || obj == sv ||
4036         how == PERL_MAGIC_arylen ||
4037         how == PERL_MAGIC_qr ||
4038         how == PERL_MAGIC_symtab ||
4039         (SvTYPE(obj) == SVt_PVGV &&
4040             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4041             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4042             GvFORM(obj) == (CV*)sv)))
4043     {
4044         mg->mg_obj = obj;
4045     }
4046     else {
4047         mg->mg_obj = SvREFCNT_inc(obj);
4048         mg->mg_flags |= MGf_REFCOUNTED;
4049     }
4050
4051     /* Normal self-ties simply pass a null object, and instead of
4052        using mg_obj directly, use the SvTIED_obj macro to produce a
4053        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4054        with an RV obj pointing to the glob containing the PVIO.  In
4055        this case, to avoid a reference loop, we need to weaken the
4056        reference.
4057     */
4058
4059     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4060         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4061     {
4062       sv_rvweaken(obj);
4063     }
4064
4065     mg->mg_type = how;
4066     mg->mg_len = namlen;
4067     if (name) {
4068         if (namlen > 0)
4069             mg->mg_ptr = savepvn(name, namlen);
4070         else if (namlen == HEf_SVKEY)
4071             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4072         else
4073             mg->mg_ptr = (char *) name;
4074     }
4075     mg->mg_virtual = vtable;
4076
4077     mg_magical(sv);
4078     if (SvGMAGICAL(sv))
4079         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4080     return mg;
4081 }
4082
4083 /*
4084 =for apidoc sv_magic
4085
4086 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4087 then adds a new magic item of type C<how> to the head of the magic list.
4088
4089 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4090 handling of the C<name> and C<namlen> arguments.
4091
4092 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4093 to add more than one instance of the same 'how'.
4094
4095 =cut
4096 */
4097
4098 void
4099 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4100 {
4101     const MGVTBL *vtable;
4102     MAGIC* mg;
4103
4104 #ifdef PERL_OLD_COPY_ON_WRITE
4105     if (SvIsCOW(sv))
4106         sv_force_normal_flags(sv, 0);
4107 #endif
4108     if (SvREADONLY(sv)) {
4109         if (
4110             /* its okay to attach magic to shared strings; the subsequent
4111              * upgrade to PVMG will unshare the string */
4112             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4113
4114             && IN_PERL_RUNTIME
4115             && how != PERL_MAGIC_regex_global
4116             && how != PERL_MAGIC_bm
4117             && how != PERL_MAGIC_fm
4118             && how != PERL_MAGIC_sv
4119             && how != PERL_MAGIC_backref
4120            )
4121         {
4122             Perl_croak(aTHX_ PL_no_modify);
4123         }
4124     }
4125     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4126         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4127             /* sv_magic() refuses to add a magic of the same 'how' as an
4128                existing one
4129              */
4130             if (how == PERL_MAGIC_taint)
4131                 mg->mg_len |= 1;
4132             return;
4133         }
4134     }
4135
4136     switch (how) {
4137     case PERL_MAGIC_sv:
4138         vtable = &PL_vtbl_sv;
4139         break;
4140     case PERL_MAGIC_overload:
4141         vtable = &PL_vtbl_amagic;
4142         break;
4143     case PERL_MAGIC_overload_elem:
4144         vtable = &PL_vtbl_amagicelem;
4145         break;
4146     case PERL_MAGIC_overload_table:
4147         vtable = &PL_vtbl_ovrld;
4148         break;
4149     case PERL_MAGIC_bm:
4150         vtable = &PL_vtbl_bm;
4151         break;
4152     case PERL_MAGIC_regdata:
4153         vtable = &PL_vtbl_regdata;
4154         break;
4155     case PERL_MAGIC_regdatum:
4156         vtable = &PL_vtbl_regdatum;
4157         break;
4158     case PERL_MAGIC_env:
4159         vtable = &PL_vtbl_env;
4160         break;
4161     case PERL_MAGIC_fm:
4162         vtable = &PL_vtbl_fm;
4163         break;
4164     case PERL_MAGIC_envelem:
4165         vtable = &PL_vtbl_envelem;
4166         break;
4167     case PERL_MAGIC_regex_global:
4168         vtable = &PL_vtbl_mglob;
4169         break;
4170     case PERL_MAGIC_isa:
4171         vtable = &PL_vtbl_isa;
4172         break;
4173     case PERL_MAGIC_isaelem:
4174         vtable = &PL_vtbl_isaelem;
4175         break;
4176     case PERL_MAGIC_nkeys:
4177         vtable = &PL_vtbl_nkeys;
4178         break;
4179     case PERL_MAGIC_dbfile:
4180         vtable = NULL;
4181         break;
4182     case PERL_MAGIC_dbline:
4183         vtable = &PL_vtbl_dbline;
4184         break;
4185 #ifdef USE_LOCALE_COLLATE
4186     case PERL_MAGIC_collxfrm:
4187         vtable = &PL_vtbl_collxfrm;
4188         break;
4189 #endif /* USE_LOCALE_COLLATE */
4190     case PERL_MAGIC_tied:
4191         vtable = &PL_vtbl_pack;
4192         break;
4193     case PERL_MAGIC_tiedelem:
4194     case PERL_MAGIC_tiedscalar:
4195         vtable = &PL_vtbl_packelem;
4196         break;
4197     case PERL_MAGIC_qr:
4198         vtable = &PL_vtbl_regexp;
4199         break;
4200     case PERL_MAGIC_sig:
4201         vtable = &PL_vtbl_sig;
4202         break;
4203     case PERL_MAGIC_sigelem:
4204         vtable = &PL_vtbl_sigelem;
4205         break;
4206     case PERL_MAGIC_taint:
4207         vtable = &PL_vtbl_taint;
4208         break;
4209     case PERL_MAGIC_uvar:
4210         vtable = &PL_vtbl_uvar;
4211         break;
4212     case PERL_MAGIC_vec:
4213         vtable = &PL_vtbl_vec;
4214         break;
4215     case PERL_MAGIC_arylen_p:
4216     case PERL_MAGIC_rhash:
4217     case PERL_MAGIC_symtab:
4218     case PERL_MAGIC_vstring:
4219         vtable = NULL;
4220         break;
4221     case PERL_MAGIC_utf8:
4222         vtable = &PL_vtbl_utf8;
4223         break;
4224     case PERL_MAGIC_substr:
4225         vtable = &PL_vtbl_substr;
4226         break;
4227     case PERL_MAGIC_defelem:
4228         vtable = &PL_vtbl_defelem;
4229         break;
4230     case PERL_MAGIC_glob:
4231         vtable = &PL_vtbl_glob;
4232         break;
4233     case PERL_MAGIC_arylen:
4234         vtable = &PL_vtbl_arylen;
4235         break;
4236     case PERL_MAGIC_pos:
4237         vtable = &PL_vtbl_pos;
4238         break;
4239     case PERL_MAGIC_backref:
4240         vtable = &PL_vtbl_backref;
4241         break;
4242     case PERL_MAGIC_ext:
4243         /* Reserved for use by extensions not perl internals.           */
4244         /* Useful for attaching extension internal data to perl vars.   */
4245         /* Note that multiple extensions may clash if magical scalars   */
4246         /* etc holding private data from one are passed to another.     */
4247         vtable = NULL;
4248         break;
4249     default:
4250         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4251     }
4252
4253     /* Rest of work is done else where */
4254     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4255
4256     switch (how) {
4257     case PERL_MAGIC_taint:
4258         mg->mg_len = 1;
4259         break;
4260     case PERL_MAGIC_ext:
4261     case PERL_MAGIC_dbfile:
4262         SvRMAGICAL_on(sv);
4263         break;
4264     }
4265 }
4266
4267 /*
4268 =for apidoc sv_unmagic
4269
4270 Removes all magic of type C<type> from an SV.
4271
4272 =cut
4273 */
4274
4275 int
4276 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4277 {
4278     MAGIC* mg;
4279     MAGIC** mgp;
4280     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4281         return 0;
4282     mgp = &SvMAGIC(sv);
4283     for (mg = *mgp; mg; mg = *mgp) {
4284         if (mg->mg_type == type) {
4285             const MGVTBL* const vtbl = mg->mg_virtual;
4286             *mgp = mg->mg_moremagic;
4287             if (vtbl && vtbl->svt_free)
4288                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4289             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4290                 if (mg->mg_len > 0)
4291                     Safefree(mg->mg_ptr);
4292                 else if (mg->mg_len == HEf_SVKEY)
4293                     SvREFCNT_dec((SV*)mg->mg_ptr);
4294                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4295                     Safefree(mg->mg_ptr);
4296             }
4297             if (mg->mg_flags & MGf_REFCOUNTED)
4298                 SvREFCNT_dec(mg->mg_obj);
4299             Safefree(mg);
4300         }
4301         else
4302             mgp = &mg->mg_moremagic;
4303     }
4304     if (!SvMAGIC(sv)) {
4305         SvMAGICAL_off(sv);
4306        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4307     }
4308
4309     return 0;
4310 }
4311
4312 /*
4313 =for apidoc sv_rvweaken
4314
4315 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4316 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4317 push a back-reference to this RV onto the array of backreferences
4318 associated with that magic.
4319
4320 =cut
4321 */
4322
4323 SV *
4324 Perl_sv_rvweaken(pTHX_ SV *sv)
4325 {
4326     SV *tsv;
4327     if (!SvOK(sv))  /* let undefs pass */
4328         return sv;
4329     if (!SvROK(sv))
4330         Perl_croak(aTHX_ "Can't weaken a nonreference");
4331     else if (SvWEAKREF(sv)) {
4332         if (ckWARN(WARN_MISC))
4333             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4334         return sv;
4335     }
4336     tsv = SvRV(sv);
4337     Perl_sv_add_backref(aTHX_ tsv, sv);
4338     SvWEAKREF_on(sv);
4339     SvREFCNT_dec(tsv);
4340     return sv;
4341 }
4342
4343 /* Give tsv backref magic if it hasn't already got it, then push a
4344  * back-reference to sv onto the array associated with the backref magic.
4345  */
4346
4347 void
4348 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4349 {
4350     AV *av;
4351     MAGIC *mg;
4352     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4353         av = (AV*)mg->mg_obj;
4354     else {
4355         av = newAV();
4356         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4357         /* av now has a refcnt of 2, which avoids it getting freed
4358          * before us during global cleanup. The extra ref is removed
4359          * by magic_killbackrefs() when tsv is being freed */
4360     }
4361     if (AvFILLp(av) >= AvMAX(av)) {
4362         av_extend(av, AvFILLp(av)+1);
4363     }
4364     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4365 }
4366
4367 /* delete a back-reference to ourselves from the backref magic associated
4368  * with the SV we point to.
4369  */
4370
4371 STATIC void
4372 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4373 {
4374     AV *av;
4375     SV **svp;
4376     I32 i;
4377     MAGIC *mg = NULL;
4378     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4379         if (PL_in_clean_all)
4380             return;
4381     }
4382     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4383         Perl_croak(aTHX_ "panic: del_backref");
4384     av = (AV *)mg->mg_obj;
4385     svp = AvARRAY(av);
4386     /* We shouldn't be in here more than once, but for paranoia reasons lets
4387        not assume this.  */
4388     for (i = AvFILLp(av); i >= 0; i--) {
4389         if (svp[i] == sv) {
4390             const SSize_t fill = AvFILLp(av);
4391             if (i != fill) {
4392                 /* We weren't the last entry.
4393                    An unordered list has this property that you can take the
4394                    last element off the end to fill the hole, and it's still
4395                    an unordered list :-)
4396                 */
4397                 svp[i] = svp[fill];
4398             }
4399             svp[fill] = Nullsv;
4400             AvFILLp(av) = fill - 1;
4401         }
4402     }
4403 }
4404
4405 /*
4406 =for apidoc sv_insert
4407
4408 Inserts a string at the specified offset/length within the SV. Similar to
4409 the Perl substr() function.
4410
4411 =cut
4412 */
4413
4414 void
4415 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4416 {
4417     register char *big;
4418     register char *mid;
4419     register char *midend;
4420     register char *bigend;
4421     register I32 i;
4422     STRLEN curlen;
4423
4424
4425     if (!bigstr)
4426         Perl_croak(aTHX_ "Can't modify non-existent substring");
4427     SvPV_force(bigstr, curlen);
4428     (void)SvPOK_only_UTF8(bigstr);
4429     if (offset + len > curlen) {
4430         SvGROW(bigstr, offset+len+1);
4431         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4432         SvCUR_set(bigstr, offset+len);
4433     }
4434
4435     SvTAINT(bigstr);
4436     i = littlelen - len;
4437     if (i > 0) {                        /* string might grow */
4438         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4439         mid = big + offset + len;
4440         midend = bigend = big + SvCUR(bigstr);
4441         bigend += i;
4442         *bigend = '\0';
4443         while (midend > mid)            /* shove everything down */
4444             *--bigend = *--midend;
4445         Move(little,big+offset,littlelen,char);
4446         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4447         SvSETMAGIC(bigstr);
4448         return;
4449     }
4450     else if (i == 0) {
4451         Move(little,SvPVX(bigstr)+offset,len,char);
4452         SvSETMAGIC(bigstr);
4453         return;
4454     }
4455
4456     big = SvPVX(bigstr);
4457     mid = big + offset;
4458     midend = mid + len;
4459     bigend = big + SvCUR(bigstr);
4460
4461     if (midend > bigend)
4462         Perl_croak(aTHX_ "panic: sv_insert");
4463
4464     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4465         if (littlelen) {
4466             Move(little, mid, littlelen,char);
4467             mid += littlelen;
4468         }
4469         i = bigend - midend;
4470         if (i > 0) {
4471             Move(midend, mid, i,char);
4472             mid += i;
4473         }
4474         *mid = '\0';
4475         SvCUR_set(bigstr, mid - big);
4476     }
4477     else if ((i = mid - big)) { /* faster from front */
4478         midend -= littlelen;
4479         mid = midend;
4480         sv_chop(bigstr,midend-i);
4481         big += i;
4482         while (i--)
4483             *--midend = *--big;
4484         if (littlelen)
4485             Move(little, mid, littlelen,char);
4486     }
4487     else if (littlelen) {
4488         midend -= littlelen;
4489         sv_chop(bigstr,midend);
4490         Move(little,midend,littlelen,char);
4491     }
4492     else {
4493         sv_chop(bigstr,midend);
4494     }
4495     SvSETMAGIC(bigstr);
4496 }
4497
4498 /*
4499 =for apidoc sv_replace
4500
4501 Make the first argument a copy of the second, then delete the original.
4502 The target SV physically takes over ownership of the body of the source SV
4503 and inherits its flags; however, the target keeps any magic it owns,
4504 and any magic in the source is discarded.
4505 Note that this is a rather specialist SV copying operation; most of the
4506 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4507
4508 =cut
4509 */
4510
4511 void
4512 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4513 {
4514     const U32 refcnt = SvREFCNT(sv);
4515     SV_CHECK_THINKFIRST_COW_DROP(sv);
4516     if (SvREFCNT(nsv) != 1) {
4517         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4518                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4519     }
4520     if (SvMAGICAL(sv)) {
4521         if (SvMAGICAL(nsv))
4522             mg_free(nsv);
4523         else
4524             sv_upgrade(nsv, SVt_PVMG);
4525         SvMAGIC_set(nsv, SvMAGIC(sv));
4526         SvFLAGS(nsv) |= SvMAGICAL(sv);
4527         SvMAGICAL_off(sv);
4528         SvMAGIC_set(sv, NULL);
4529     }
4530     SvREFCNT(sv) = 0;
4531     sv_clear(sv);
4532     assert(!SvREFCNT(sv));
4533 #ifdef DEBUG_LEAKING_SCALARS
4534     sv->sv_flags  = nsv->sv_flags;
4535     sv->sv_any    = nsv->sv_any;
4536     sv->sv_refcnt = nsv->sv_refcnt;
4537     sv->sv_u      = nsv->sv_u;
4538 #else
4539     StructCopy(nsv,sv,SV);
4540 #endif
4541     /* Currently could join these into one piece of pointer arithmetic, but
4542        it would be unclear.  */
4543     if(SvTYPE(sv) == SVt_IV)
4544         SvANY(sv)
4545             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4546     else if (SvTYPE(sv) == SVt_RV) {
4547         SvANY(sv) = &sv->sv_u.svu_rv;
4548     }
4549         
4550
4551 #ifdef PERL_OLD_COPY_ON_WRITE
4552     if (SvIsCOW_normal(nsv)) {
4553         /* We need to follow the pointers around the loop to make the
4554            previous SV point to sv, rather than nsv.  */
4555         SV *next;
4556         SV *current = nsv;
4557         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4558             assert(next);
4559             current = next;
4560             assert(SvPVX_const(current) == SvPVX_const(nsv));
4561         }
4562         /* Make the SV before us point to the SV after us.  */
4563         if (DEBUG_C_TEST) {
4564             PerlIO_printf(Perl_debug_log, "previous is\n");
4565             sv_dump(current);
4566             PerlIO_printf(Perl_debug_log,
4567                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4568                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4569         }
4570         SV_COW_NEXT_SV_SET(current, sv);
4571     }
4572 #endif
4573     SvREFCNT(sv) = refcnt;
4574     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4575     SvREFCNT(nsv) = 0;
4576     del_SV(nsv);
4577 }
4578
4579 /*
4580 =for apidoc sv_clear
4581
4582 Clear an SV: call any destructors, free up any memory used by the body,
4583 and free the body itself. The SV's head is I<not> freed, although
4584 its type is set to all 1's so that it won't inadvertently be assumed
4585 to be live during global destruction etc.
4586 This function should only be called when REFCNT is zero. Most of the time
4587 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4588 instead.
4589
4590 =cut
4591 */
4592
4593 void
4594 Perl_sv_clear(pTHX_ register SV *sv)
4595 {
4596     dVAR;
4597     const U32 type = SvTYPE(sv);
4598     const struct body_details *const sv_type_details
4599         = bodies_by_type + type;
4600
4601     assert(sv);
4602     assert(SvREFCNT(sv) == 0);
4603
4604     if (type <= SVt_IV)
4605         return;
4606
4607     if (SvOBJECT(sv)) {
4608         if (PL_defstash) {              /* Still have a symbol table? */
4609             dSP;
4610             HV* stash;
4611             do {        
4612                 CV* destructor;
4613                 stash = SvSTASH(sv);
4614                 destructor = StashHANDLER(stash,DESTROY);
4615                 if (destructor) {
4616                     SV* const tmpref = newRV(sv);
4617                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4618                     ENTER;
4619                     PUSHSTACKi(PERLSI_DESTROY);
4620                     EXTEND(SP, 2);
4621                     PUSHMARK(SP);
4622                     PUSHs(tmpref);
4623                     PUTBACK;
4624                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4625                 
4626                 
4627                     POPSTACK;
4628                     SPAGAIN;
4629                     LEAVE;
4630                     if(SvREFCNT(tmpref) < 2) {
4631                         /* tmpref is not kept alive! */
4632                         SvREFCNT(sv)--;
4633                         SvRV_set(tmpref, NULL);
4634                         SvROK_off(tmpref);
4635                     }
4636                     SvREFCNT_dec(tmpref);
4637                 }
4638             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4639
4640
4641             if (SvREFCNT(sv)) {
4642                 if (PL_in_clean_objs)
4643                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4644                           HvNAME_get(stash));
4645                 /* DESTROY gave object new lease on life */
4646                 return;
4647             }
4648         }
4649
4650         if (SvOBJECT(sv)) {
4651             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4652             SvOBJECT_off(sv);   /* Curse the object. */
4653             if (type != SVt_PVIO)
4654                 --PL_sv_objcount;       /* XXX Might want something more general */
4655         }
4656     }
4657     if (type >= SVt_PVMG) {
4658         if (SvMAGIC(sv))
4659             mg_free(sv);
4660         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4661             SvREFCNT_dec(SvSTASH(sv));
4662     }
4663     switch (type) {
4664     case SVt_PVIO:
4665         if (IoIFP(sv) &&
4666             IoIFP(sv) != PerlIO_stdin() &&
4667             IoIFP(sv) != PerlIO_stdout() &&
4668             IoIFP(sv) != PerlIO_stderr())
4669         {
4670             io_close((IO*)sv, FALSE);
4671         }
4672         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4673             PerlDir_close(IoDIRP(sv));
4674         IoDIRP(sv) = (DIR*)NULL;
4675         Safefree(IoTOP_NAME(sv));
4676         Safefree(IoFMT_NAME(sv));
4677         Safefree(IoBOTTOM_NAME(sv));
4678         goto freescalar;
4679     case SVt_PVBM:
4680         goto freescalar;
4681     case SVt_PVCV:
4682     case SVt_PVFM:
4683         cv_undef((CV*)sv);
4684         goto freescalar;
4685     case SVt_PVHV:
4686         hv_undef((HV*)sv);
4687         break;
4688     case SVt_PVAV:
4689         av_undef((AV*)sv);
4690         break;
4691     case SVt_PVLV:
4692         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4693             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4694             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4695             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4696         }
4697         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4698             SvREFCNT_dec(LvTARG(sv));
4699         goto freescalar;
4700     case SVt_PVGV:
4701         gp_free((GV*)sv);
4702         Safefree(GvNAME(sv));
4703         /* If we're in a stash, we don't own a reference to it. However it does
4704            have a back reference to us, which needs to be cleared.  */
4705         if (GvSTASH(sv))
4706             sv_del_backref((SV*)GvSTASH(sv), sv);
4707     case SVt_PVMG:
4708     case SVt_PVNV:
4709     case SVt_PVIV:
4710       freescalar:
4711         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4712         if (SvOOK(sv)) {
4713             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4714             /* Don't even bother with turning off the OOK flag.  */
4715         }
4716     case SVt_PV:
4717     case SVt_RV:
4718         if (SvROK(sv)) {
4719             SV *target = SvRV(sv);
4720             if (SvWEAKREF(sv))
4721                 sv_del_backref(target, sv);
4722             else
4723                 SvREFCNT_dec(target);
4724         }
4725 #ifdef PERL_OLD_COPY_ON_WRITE
4726         else if (SvPVX_const(sv)) {
4727             if (SvIsCOW(sv)) {
4728                 /* I believe I need to grab the global SV mutex here and
4729                    then recheck the COW status.  */
4730                 if (DEBUG_C_TEST) {
4731                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4732                     sv_dump(sv);
4733                 }
4734                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4735                                SV_COW_NEXT_SV(sv));
4736                 /* And drop it here.  */
4737                 SvFAKE_off(sv);
4738             } else if (SvLEN(sv)) {
4739                 Safefree(SvPVX_const(sv));
4740             }
4741         }
4742 #else
4743         else if (SvPVX_const(sv) && SvLEN(sv))
4744             Safefree(SvPVX_mutable(sv));
4745         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4746             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4747             SvFAKE_off(sv);
4748         }
4749 #endif
4750         break;
4751     case SVt_NV:
4752         break;
4753     }
4754
4755     SvFLAGS(sv) &= SVf_BREAK;
4756     SvFLAGS(sv) |= SVTYPEMASK;
4757
4758     if (sv_type_details->arena) {
4759         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4760                  &PL_body_roots[type]);
4761     }
4762     else if (sv_type_details->size) {
4763         my_safefree(SvANY(sv));
4764     }
4765 }
4766
4767 /*
4768 =for apidoc sv_newref
4769
4770 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
4771 instead.
4772
4773 =cut
4774 */
4775
4776 SV *
4777 Perl_sv_newref(pTHX_ SV *sv)
4778 {
4779     if (sv)
4780         (SvREFCNT(sv))++;
4781     return sv;
4782 }
4783
4784 /*
4785 =for apidoc sv_free
4786
4787 Decrement an SV's reference count, and if it drops to zero, call
4788 C<sv_clear> to invoke destructors and free up any memory used by
4789 the body; finally, deallocate the SV's head itself.
4790 Normally called via a wrapper macro C<SvREFCNT_dec>.
4791
4792 =cut
4793 */
4794
4795 void
4796 Perl_sv_free(pTHX_ SV *sv)
4797 {
4798     dVAR;
4799     if (!sv)
4800         return;
4801     if (SvREFCNT(sv) == 0) {
4802         if (SvFLAGS(sv) & SVf_BREAK)
4803             /* this SV's refcnt has been artificially decremented to
4804              * trigger cleanup */
4805             return;
4806         if (PL_in_clean_all) /* All is fair */
4807             return;
4808         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4809             /* make sure SvREFCNT(sv)==0 happens very seldom */
4810             SvREFCNT(sv) = (~(U32)0)/2;
4811             return;
4812         }
4813         if (ckWARN_d(WARN_INTERNAL)) {
4814             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
4815                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
4816                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4817 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
4818             Perl_dump_sv_child(aTHX_ sv);
4819 #endif
4820         }
4821         return;
4822     }
4823     if (--(SvREFCNT(sv)) > 0)
4824         return;
4825     Perl_sv_free2(aTHX_ sv);
4826 }
4827
4828 void
4829 Perl_sv_free2(pTHX_ SV *sv)
4830 {
4831     dVAR;
4832 #ifdef DEBUGGING
4833     if (SvTEMP(sv)) {
4834         if (ckWARN_d(WARN_DEBUGGING))
4835             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
4836                         "Attempt to free temp prematurely: SV 0x%"UVxf
4837                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4838         return;
4839     }
4840 #endif
4841     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4842         /* make sure SvREFCNT(sv)==0 happens very seldom */
4843         SvREFCNT(sv) = (~(U32)0)/2;
4844         return;
4845     }
4846     sv_clear(sv);
4847     if (! SvREFCNT(sv))
4848         del_SV(sv);
4849 }
4850
4851 /*
4852 =for apidoc sv_len
4853
4854 Returns the length of the string in the SV. Handles magic and type
4855 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
4856
4857 =cut
4858 */
4859
4860 STRLEN
4861 Perl_sv_len(pTHX_ register SV *sv)
4862 {
4863     STRLEN len;
4864
4865     if (!sv)
4866         return 0;
4867
4868     if (SvGMAGICAL(sv))
4869         len = mg_length(sv);
4870     else
4871         (void)SvPV_const(sv, len);
4872     return len;
4873 }
4874
4875 /*
4876 =for apidoc sv_len_utf8
4877
4878 Returns the number of characters in the string in an SV, counting wide
4879 UTF-8 bytes as a single character. Handles magic and type coercion.
4880
4881 =cut
4882 */
4883
4884 /*
4885  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
4886  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
4887  * (Note that the mg_len is not the length of the mg_ptr field.)
4888  *
4889  */
4890
4891 STRLEN
4892 Perl_sv_len_utf8(pTHX_ register SV *sv)
4893 {
4894     if (!sv)
4895         return 0;
4896
4897     if (SvGMAGICAL(sv))
4898         return mg_length(sv);
4899     else
4900     {
4901         STRLEN len, ulen;
4902         const U8 *s = (U8*)SvPV_const(sv, len);
4903         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
4904
4905         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
4906             ulen = mg->mg_len;
4907 #ifdef PERL_UTF8_CACHE_ASSERT
4908             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
4909 #endif
4910         }
4911         else {
4912             ulen = Perl_utf8_length(aTHX_ s, s + len);
4913             if (!mg && !SvREADONLY(sv)) {
4914                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
4915                 mg = mg_find(sv, PERL_MAGIC_utf8);
4916                 assert(mg);
4917             }
4918             if (mg)
4919                 mg->mg_len = ulen;
4920         }
4921         return ulen;
4922     }
4923 }
4924
4925 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
4926  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4927  * between UTF-8 and byte offsets.  There are two (substr offset and substr
4928  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
4929  * and byte offset) cache positions.
4930  *
4931  * The mg_len field is used by sv_len_utf8(), see its comments.
4932  * Note that the mg_len is not the length of the mg_ptr field.
4933  *
4934  */
4935 STATIC bool
4936 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
4937                    I32 offsetp, const U8 *s, const U8 *start)
4938 {
4939     bool found = FALSE;
4940
4941     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4942         if (!*mgp)
4943             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
4944         assert(*mgp);
4945
4946         if ((*mgp)->mg_ptr)
4947             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4948         else {
4949             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
4950             (*mgp)->mg_ptr = (char *) *cachep;
4951         }
4952         assert(*cachep);
4953
4954         (*cachep)[i]   = offsetp;
4955         (*cachep)[i+1] = s - start;
4956         found = TRUE;
4957     }
4958
4959     return found;
4960 }
4961
4962 /*
4963  * S_utf8_mg_pos() is used to query and update mg_ptr field of
4964  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4965  * between UTF-8 and byte offsets.  See also the comments of
4966  * S_utf8_mg_pos_init().
4967  *
4968  */
4969 STATIC bool
4970 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
4971 {
4972     bool found = FALSE;
4973
4974     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4975         if (!*mgp)
4976             *mgp = mg_find(sv, PERL_MAGIC_utf8);
4977         if (*mgp && (*mgp)->mg_ptr) {
4978             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4979             ASSERT_UTF8_CACHE(*cachep);
4980             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
4981                  found = TRUE;
4982             else {                      /* We will skip to the right spot. */
4983                  STRLEN forw  = 0;
4984                  STRLEN backw = 0;
4985                  const U8* p = NULL;
4986
4987                  /* The assumption is that going backward is half
4988                   * the speed of going forward (that's where the
4989                   * 2 * backw in the below comes from).  (The real
4990                   * figure of course depends on the UTF-8 data.) */
4991
4992                  if ((*cachep)[i] > (STRLEN)uoff) {
4993                       forw  = uoff;
4994                       backw = (*cachep)[i] - (STRLEN)uoff;
4995
4996                       if (forw < 2 * backw)
4997                            p = start;
4998                       else
4999                            p = start + (*cachep)[i+1];
5000                  }
5001                  /* Try this only for the substr offset (i == 0),
5002                   * not for the substr length (i == 2). */
5003                  else if (i == 0) { /* (*cachep)[i] < uoff */
5004                       const STRLEN ulen = sv_len_utf8(sv);
5005
5006                       if ((STRLEN)uoff < ulen) {
5007                            forw  = (STRLEN)uoff - (*cachep)[i];
5008                            backw = ulen - (STRLEN)uoff;
5009
5010                            if (forw < 2 * backw)
5011                                 p = start + (*cachep)[i+1];
5012                            else
5013                                 p = send;
5014                       }
5015
5016                       /* If the string is not long enough for uoff,
5017                        * we could extend it, but not at this low a level. */
5018                  }
5019
5020                  if (p) {
5021                       if (forw < 2 * backw) {
5022                            while (forw--)
5023                                 p += UTF8SKIP(p);
5024                       }
5025                       else {
5026                            while (backw--) {
5027                                 p--;
5028                                 while (UTF8_IS_CONTINUATION(*p))
5029                                      p--;
5030                            }
5031                       }
5032
5033                       /* Update the cache. */
5034                       (*cachep)[i]   = (STRLEN)uoff;
5035                       (*cachep)[i+1] = p - start;
5036
5037                       /* Drop the stale "length" cache */
5038                       if (i == 0) {
5039                           (*cachep)[2] = 0;
5040                           (*cachep)[3] = 0;
5041                       }
5042
5043                       found = TRUE;
5044                  }
5045             }
5046             if (found) {        /* Setup the return values. */
5047                  *offsetp = (*cachep)[i+1];
5048                  *sp = start + *offsetp;
5049                  if (*sp >= send) {
5050                       *sp = send;
5051                       *offsetp = send - start;
5052                  }
5053                  else if (*sp < start) {
5054                       *sp = start;
5055                       *offsetp = 0;
5056                  }
5057             }
5058         }
5059 #ifdef PERL_UTF8_CACHE_ASSERT
5060         if (found) {
5061              U8 *s = start;
5062              I32 n = uoff;
5063
5064              while (n-- && s < send)
5065                   s += UTF8SKIP(s);
5066
5067              if (i == 0) {
5068                   assert(*offsetp == s - start);
5069                   assert((*cachep)[0] == (STRLEN)uoff);
5070                   assert((*cachep)[1] == *offsetp);
5071              }
5072              ASSERT_UTF8_CACHE(*cachep);
5073         }
5074 #endif
5075     }
5076
5077     return found;
5078 }
5079
5080 /*
5081 =for apidoc sv_pos_u2b
5082
5083 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5084 the start of the string, to a count of the equivalent number of bytes; if
5085 lenp is non-zero, it does the same to lenp, but this time starting from
5086 the offset, rather than from the start of the string. Handles magic and
5087 type coercion.
5088
5089 =cut
5090 */
5091
5092 /*
5093  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5094  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5095  * byte offsets.  See also the comments of S_utf8_mg_pos().
5096  *
5097  */
5098
5099 void
5100 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5101 {
5102     const U8 *start;
5103     STRLEN len;
5104
5105     if (!sv)
5106         return;
5107
5108     start = (U8*)SvPV_const(sv, len);
5109     if (len) {
5110         STRLEN boffset = 0;
5111         STRLEN *cache = 0;
5112         const U8 *s = start;
5113         I32 uoffset = *offsetp;
5114         const U8 * const send = s + len;
5115         MAGIC *mg = 0;
5116         bool found = FALSE;
5117
5118          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5119              found = TRUE;
5120          if (!found && uoffset > 0) {
5121               while (s < send && uoffset--)
5122                    s += UTF8SKIP(s);
5123               if (s >= send)
5124                    s = send;
5125               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5126                   boffset = cache[1];
5127               *offsetp = s - start;
5128          }
5129          if (lenp) {
5130               found = FALSE;
5131               start = s;
5132               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5133                   *lenp -= boffset;
5134                   found = TRUE;
5135               }
5136               if (!found && *lenp > 0) {
5137                    I32 ulen = *lenp;
5138                    if (ulen > 0)
5139                         while (s < send && ulen--)
5140                              s += UTF8SKIP(s);
5141                    if (s >= send)
5142                         s = send;
5143                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5144               }
5145               *lenp = s - start;
5146          }
5147          ASSERT_UTF8_CACHE(cache);
5148     }
5149     else {
5150          *offsetp = 0;
5151          if (lenp)
5152               *lenp = 0;
5153     }
5154
5155     return;
5156 }
5157
5158 /*
5159 =for apidoc sv_pos_b2u
5160
5161 Converts the value pointed to by offsetp from a count of bytes from the
5162 start of the string, to a count of the equivalent number of UTF-8 chars.
5163 Handles magic and type coercion.
5164
5165 =cut
5166 */
5167
5168 /*
5169  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5170  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5171  * byte offsets.  See also the comments of S_utf8_mg_pos().
5172  *
5173  */
5174
5175 void
5176 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5177 {
5178     const U8* s;
5179     STRLEN len;
5180
5181     if (!sv)
5182         return;
5183
5184     s = (const U8*)SvPV_const(sv, len);
5185     if ((I32)len < *offsetp)
5186         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5187     else {
5188         const U8* send = s + *offsetp;
5189         MAGIC* mg = NULL;
5190         STRLEN *cache = NULL;
5191
5192         len = 0;
5193
5194         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5195             mg = mg_find(sv, PERL_MAGIC_utf8);
5196             if (mg && mg->mg_ptr) {
5197                 cache = (STRLEN *) mg->mg_ptr;
5198                 if (cache[1] == (STRLEN)*offsetp) {
5199                     /* An exact match. */
5200                     *offsetp = cache[0];
5201
5202                     return;
5203                 }
5204                 else if (cache[1] < (STRLEN)*offsetp) {
5205                     /* We already know part of the way. */
5206                     len = cache[0];
5207                     s  += cache[1];
5208                     /* Let the below loop do the rest. */
5209                 }
5210                 else { /* cache[1] > *offsetp */
5211                     /* We already know all of the way, now we may
5212                      * be able to walk back.  The same assumption
5213                      * is made as in S_utf8_mg_pos(), namely that
5214                      * walking backward is twice slower than
5215                      * walking forward. */
5216                     const STRLEN forw  = *offsetp;
5217                     STRLEN backw = cache[1] - *offsetp;
5218
5219                     if (!(forw < 2 * backw)) {
5220                         const U8 *p = s + cache[1];
5221                         STRLEN ubackw = 0;
5222                         
5223                         cache[1] -= backw;
5224
5225                         while (backw--) {
5226                             p--;
5227                             while (UTF8_IS_CONTINUATION(*p)) {
5228                                 p--;
5229                                 backw--;
5230                             }
5231                             ubackw++;
5232                         }
5233
5234                         cache[0] -= ubackw;
5235                         *offsetp = cache[0];
5236
5237                         /* Drop the stale "length" cache */
5238                         cache[2] = 0;
5239                         cache[3] = 0;
5240
5241                         return;
5242                     }
5243                 }
5244             }
5245             ASSERT_UTF8_CACHE(cache);
5246         }
5247
5248         while (s < send) {
5249             STRLEN n = 1;
5250
5251             /* Call utf8n_to_uvchr() to validate the sequence
5252              * (unless a simple non-UTF character) */
5253             if (!UTF8_IS_INVARIANT(*s))
5254                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5255             if (n > 0) {
5256                 s += n;
5257                 len++;
5258             }
5259             else
5260                 break;
5261         }
5262
5263         if (!SvREADONLY(sv)) {
5264             if (!mg) {
5265                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5266                 mg = mg_find(sv, PERL_MAGIC_utf8);
5267             }
5268             assert(mg);
5269
5270             if (!mg->mg_ptr) {
5271                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5272                 mg->mg_ptr = (char *) cache;
5273             }
5274             assert(cache);
5275
5276             cache[0] = len;
5277             cache[1] = *offsetp;
5278             /* Drop the stale "length" cache */
5279             cache[2] = 0;
5280             cache[3] = 0;
5281         }
5282
5283         *offsetp = len;
5284     }
5285     return;
5286 }
5287
5288 /*
5289 =for apidoc sv_eq
5290
5291 Returns a boolean indicating whether the strings in the two SVs are
5292 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5293 coerce its args to strings if necessary.
5294
5295 =cut
5296 */
5297
5298 I32
5299 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5300 {
5301     const char *pv1;
5302     STRLEN cur1;
5303     const char *pv2;
5304     STRLEN cur2;
5305     I32  eq     = 0;
5306     char *tpv   = Nullch;
5307     SV* svrecode = Nullsv;
5308
5309     if (!sv1) {
5310         pv1 = "";
5311         cur1 = 0;
5312     }
5313     else
5314         pv1 = SvPV_const(sv1, cur1);
5315
5316     if (!sv2){
5317         pv2 = "";
5318         cur2 = 0;
5319     }
5320     else
5321         pv2 = SvPV_const(sv2, cur2);
5322
5323     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5324         /* Differing utf8ness.
5325          * Do not UTF8size the comparands as a side-effect. */
5326          if (PL_encoding) {
5327               if (SvUTF8(sv1)) {
5328                    svrecode = newSVpvn(pv2, cur2);
5329                    sv_recode_to_utf8(svrecode, PL_encoding);
5330                    pv2 = SvPV_const(svrecode, cur2);
5331               }
5332               else {
5333                    svrecode = newSVpvn(pv1, cur1);
5334                    sv_recode_to_utf8(svrecode, PL_encoding);
5335                    pv1 = SvPV_const(svrecode, cur1);
5336               }
5337               /* Now both are in UTF-8. */
5338               if (cur1 != cur2) {
5339                    SvREFCNT_dec(svrecode);
5340                    return FALSE;
5341               }
5342          }
5343          else {
5344               bool is_utf8 = TRUE;
5345
5346               if (SvUTF8(sv1)) {
5347                    /* sv1 is the UTF-8 one,
5348                     * if is equal it must be downgrade-able */
5349                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5350                                                      &cur1, &is_utf8);
5351                    if (pv != pv1)
5352                         pv1 = tpv = pv;
5353               }
5354               else {
5355                    /* sv2 is the UTF-8 one,
5356                     * if is equal it must be downgrade-able */
5357                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5358                                                       &cur2, &is_utf8);
5359                    if (pv != pv2)
5360                         pv2 = tpv = pv;
5361               }
5362               if (is_utf8) {
5363                    /* Downgrade not possible - cannot be eq */
5364                    assert (tpv == 0);
5365                    return FALSE;
5366               }
5367          }
5368     }
5369
5370     if (cur1 == cur2)
5371         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5372         
5373     if (svrecode)
5374          SvREFCNT_dec(svrecode);
5375
5376     if (tpv)
5377         Safefree(tpv);
5378
5379     return eq;
5380 }
5381
5382 /*
5383 =for apidoc sv_cmp
5384
5385 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5386 string in C<sv1> is less than, equal to, or greater than the string in
5387 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5388 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5389
5390 =cut
5391 */
5392
5393 I32
5394 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5395 {
5396     STRLEN cur1, cur2;
5397     const char *pv1, *pv2;
5398     char *tpv = Nullch;
5399     I32  cmp;
5400     SV *svrecode = Nullsv;
5401
5402     if (!sv1) {
5403         pv1 = "";
5404         cur1 = 0;
5405     }
5406     else
5407         pv1 = SvPV_const(sv1, cur1);
5408
5409     if (!sv2) {
5410         pv2 = "";
5411         cur2 = 0;
5412     }
5413     else
5414         pv2 = SvPV_const(sv2, cur2);
5415
5416     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5417         /* Differing utf8ness.
5418          * Do not UTF8size the comparands as a side-effect. */
5419         if (SvUTF8(sv1)) {
5420             if (PL_encoding) {
5421                  svrecode = newSVpvn(pv2, cur2);
5422                  sv_recode_to_utf8(svrecode, PL_encoding);
5423                  pv2 = SvPV_const(svrecode, cur2);
5424             }
5425             else {
5426                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5427             }
5428         }
5429         else {
5430             if (PL_encoding) {
5431                  svrecode = newSVpvn(pv1, cur1);
5432                  sv_recode_to_utf8(svrecode, PL_encoding);
5433                  pv1 = SvPV_const(svrecode, cur1);
5434             }
5435             else {
5436                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5437             }
5438         }
5439     }
5440
5441     if (!cur1) {
5442         cmp = cur2 ? -1 : 0;
5443     } else if (!cur2) {
5444         cmp = 1;
5445     } else {
5446         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5447
5448         if (retval) {
5449             cmp = retval < 0 ? -1 : 1;
5450         } else if (cur1 == cur2) {
5451             cmp = 0;
5452         } else {
5453             cmp = cur1 < cur2 ? -1 : 1;
5454         }
5455     }
5456
5457     if (svrecode)
5458          SvREFCNT_dec(svrecode);
5459
5460     if (tpv)
5461         Safefree(tpv);
5462
5463     return cmp;
5464 }
5465
5466 /*
5467 =for apidoc sv_cmp_locale
5468
5469 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5470 'use bytes' aware, handles get magic, and will coerce its args to strings
5471 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5472
5473 =cut
5474 */
5475
5476 I32
5477 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5478 {
5479 #ifdef USE_LOCALE_COLLATE
5480
5481     char *pv1, *pv2;
5482     STRLEN len1, len2;
5483     I32 retval;
5484
5485     if (PL_collation_standard)
5486         goto raw_compare;
5487
5488     len1 = 0;
5489     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5490     len2 = 0;
5491     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5492
5493     if (!pv1 || !len1) {
5494         if (pv2 && len2)
5495             return -1;
5496         else
5497             goto raw_compare;
5498     }
5499     else {
5500         if (!pv2 || !len2)
5501             return 1;
5502     }
5503
5504     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5505
5506     if (retval)
5507         return retval < 0 ? -1 : 1;
5508
5509     /*
5510      * When the result of collation is equality, that doesn't mean
5511      * that there are no differences -- some locales exclude some
5512      * characters from consideration.  So to avoid false equalities,
5513      * we use the raw string as a tiebreaker.
5514      */
5515
5516   raw_compare:
5517     /* FALL THROUGH */
5518
5519 #endif /* USE_LOCALE_COLLATE */
5520
5521     return sv_cmp(sv1, sv2);
5522 }
5523
5524
5525 #ifdef USE_LOCALE_COLLATE
5526
5527 /*
5528 =for apidoc sv_collxfrm
5529
5530 Add Collate Transform magic to an SV if it doesn't already have it.
5531
5532 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5533 scalar data of the variable, but transformed to such a format that a normal
5534 memory comparison can be used to compare the data according to the locale
5535 settings.
5536
5537 =cut
5538 */
5539
5540 char *
5541 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5542 {
5543     MAGIC *mg;
5544
5545     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5546     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5547         const char *s;
5548         char *xf;
5549         STRLEN len, xlen;
5550
5551         if (mg)
5552             Safefree(mg->mg_ptr);
5553         s = SvPV_const(sv, len);
5554         if ((xf = mem_collxfrm(s, len, &xlen))) {
5555             if (SvREADONLY(sv)) {
5556                 SAVEFREEPV(xf);
5557                 *nxp = xlen;
5558                 return xf + sizeof(PL_collation_ix);
5559             }
5560             if (! mg) {
5561                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5562                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5563                 assert(mg);
5564             }
5565             mg->mg_ptr = xf;
5566             mg->mg_len = xlen;
5567         }
5568         else {
5569             if (mg) {
5570                 mg->mg_ptr = NULL;
5571                 mg->mg_len = -1;
5572             }
5573         }
5574     }
5575     if (mg && mg->mg_ptr) {
5576         *nxp = mg->mg_len;
5577         return mg->mg_ptr + sizeof(PL_collation_ix);
5578     }
5579     else {
5580         *nxp = 0;
5581         return NULL;
5582     }
5583 }
5584
5585 #endif /* USE_LOCALE_COLLATE */
5586
5587 /*
5588 =for apidoc sv_gets
5589
5590 Get a line from the filehandle and store it into the SV, optionally
5591 appending to the currently-stored string.
5592
5593 =cut
5594 */
5595
5596 char *
5597 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5598 {
5599     const char *rsptr;
5600     STRLEN rslen;
5601     register STDCHAR rslast;
5602     register STDCHAR *bp;
5603     register I32 cnt;
5604     I32 i = 0;
5605     I32 rspara = 0;
5606     I32 recsize;
5607
5608     if (SvTHINKFIRST(sv))
5609         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5610     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5611        from <>.
5612        However, perlbench says it's slower, because the existing swipe code
5613        is faster than copy on write.
5614        Swings and roundabouts.  */
5615     SvUPGRADE(sv, SVt_PV);
5616
5617     SvSCREAM_off(sv);
5618
5619     if (append) {
5620         if (PerlIO_isutf8(fp)) {
5621             if (!SvUTF8(sv)) {
5622                 sv_utf8_upgrade_nomg(sv);
5623                 sv_pos_u2b(sv,&append,0);
5624             }
5625         } else if (SvUTF8(sv)) {
5626             SV * const tsv = NEWSV(0,0);
5627             sv_gets(tsv, fp, 0);
5628             sv_utf8_upgrade_nomg(tsv);
5629             SvCUR_set(sv,append);
5630             sv_catsv(sv,tsv);
5631             sv_free(tsv);
5632             goto return_string_or_null;
5633         }
5634     }
5635
5636     SvPOK_only(sv);
5637     if (PerlIO_isutf8(fp))
5638         SvUTF8_on(sv);
5639
5640     if (IN_PERL_COMPILETIME) {
5641         /* we always read code in line mode */
5642         rsptr = "\n";
5643         rslen = 1;
5644     }
5645     else if (RsSNARF(PL_rs)) {
5646         /* If it is a regular disk file use size from stat() as estimate
5647            of amount we are going to read - may result in malloc-ing
5648            more memory than we realy need if layers bellow reduce
5649            size we read (e.g. CRLF or a gzip layer)
5650          */
5651         Stat_t st;
5652         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5653             const Off_t offset = PerlIO_tell(fp);
5654             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5655                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5656             }
5657         }
5658         rsptr = NULL;
5659         rslen = 0;
5660     }
5661     else if (RsRECORD(PL_rs)) {
5662       I32 bytesread;
5663       char *buffer;
5664
5665       /* Grab the size of the record we're getting */
5666       recsize = SvIV(SvRV(PL_rs));
5667       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5668       /* Go yank in */
5669 #ifdef VMS
5670       /* VMS wants read instead of fread, because fread doesn't respect */
5671       /* RMS record boundaries. This is not necessarily a good thing to be */
5672       /* doing, but we've got no other real choice - except avoid stdio
5673          as implementation - perhaps write a :vms layer ?
5674        */
5675       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5676 #else
5677       bytesread = PerlIO_read(fp, buffer, recsize);
5678 #endif
5679       if (bytesread < 0)
5680           bytesread = 0;
5681       SvCUR_set(sv, bytesread += append);
5682       buffer[bytesread] = '\0';
5683       goto return_string_or_null;
5684     }
5685     else if (RsPARA(PL_rs)) {
5686         rsptr = "\n\n";
5687         rslen = 2;
5688         rspara = 1;
5689     }
5690     else {
5691         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5692         if (PerlIO_isutf8(fp)) {
5693             rsptr = SvPVutf8(PL_rs, rslen);
5694         }
5695         else {
5696             if (SvUTF8(PL_rs)) {
5697                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5698                     Perl_croak(aTHX_ "Wide character in $/");
5699                 }
5700             }
5701             rsptr = SvPV_const(PL_rs, rslen);
5702         }
5703     }
5704
5705     rslast = rslen ? rsptr[rslen - 1] : '\0';
5706
5707     if (rspara) {               /* have to do this both before and after */
5708         do {                    /* to make sure file boundaries work right */
5709             if (PerlIO_eof(fp))
5710                 return 0;
5711             i = PerlIO_getc(fp);
5712             if (i != '\n') {
5713                 if (i == -1)
5714                     return 0;
5715                 PerlIO_ungetc(fp,i);
5716                 break;
5717             }
5718         } while (i != EOF);
5719     }
5720
5721     /* See if we know enough about I/O mechanism to cheat it ! */
5722
5723     /* This used to be #ifdef test - it is made run-time test for ease
5724        of abstracting out stdio interface. One call should be cheap
5725        enough here - and may even be a macro allowing compile
5726        time optimization.
5727      */
5728
5729     if (PerlIO_fast_gets(fp)) {
5730
5731     /*
5732      * We're going to steal some values from the stdio struct
5733      * and put EVERYTHING in the innermost loop into registers.
5734      */
5735     register STDCHAR *ptr;
5736     STRLEN bpx;
5737     I32 shortbuffered;
5738
5739 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5740     /* An ungetc()d char is handled separately from the regular
5741      * buffer, so we getc() it back out and stuff it in the buffer.
5742      */
5743     i = PerlIO_getc(fp);
5744     if (i == EOF) return 0;
5745     *(--((*fp)->_ptr)) = (unsigned char) i;
5746     (*fp)->_cnt++;
5747 #endif
5748
5749     /* Here is some breathtakingly efficient cheating */
5750
5751     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5752     /* make sure we have the room */
5753     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5754         /* Not room for all of it
5755            if we are looking for a separator and room for some
5756          */
5757         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5758             /* just process what we have room for */
5759             shortbuffered = cnt - SvLEN(sv) + append + 1;
5760             cnt -= shortbuffered;
5761         }
5762         else {
5763             shortbuffered = 0;
5764             /* remember that cnt can be negative */
5765             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5766         }
5767     }
5768     else
5769         shortbuffered = 0;
5770     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
5771     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
5772     DEBUG_P(PerlIO_printf(Perl_debug_log,
5773         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5774     DEBUG_P(PerlIO_printf(Perl_debug_log,
5775         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5776                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5777                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
5778     for (;;) {
5779       screamer:
5780         if (cnt > 0) {
5781             if (rslen) {
5782                 while (cnt > 0) {                    /* this     |  eat */
5783                     cnt--;
5784                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
5785                         goto thats_all_folks;        /* screams  |  sed :-) */
5786                 }
5787             }
5788             else {
5789                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
5790                 bp += cnt;                           /* screams  |  dust */
5791                 ptr += cnt;                          /* louder   |  sed :-) */
5792                 cnt = 0;
5793             }
5794         }
5795         
5796         if (shortbuffered) {            /* oh well, must extend */
5797             cnt = shortbuffered;
5798             shortbuffered = 0;
5799             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
5800             SvCUR_set(sv, bpx);
5801             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
5802             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
5803             continue;
5804         }
5805
5806         DEBUG_P(PerlIO_printf(Perl_debug_log,
5807                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
5808                               PTR2UV(ptr),(long)cnt));
5809         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
5810 #if 0
5811         DEBUG_P(PerlIO_printf(Perl_debug_log,
5812             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5813             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5814             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5815 #endif
5816         /* This used to call 'filbuf' in stdio form, but as that behaves like
5817            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
5818            another abstraction.  */
5819         i   = PerlIO_getc(fp);          /* get more characters */
5820 #if 0
5821         DEBUG_P(PerlIO_printf(Perl_debug_log,
5822             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5823             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5824             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5825 #endif
5826         cnt = PerlIO_get_cnt(fp);
5827         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
5828         DEBUG_P(PerlIO_printf(Perl_debug_log,
5829             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5830
5831         if (i == EOF)                   /* all done for ever? */
5832             goto thats_really_all_folks;
5833
5834         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
5835         SvCUR_set(sv, bpx);
5836         SvGROW(sv, bpx + cnt + 2);
5837         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
5838
5839         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
5840
5841         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
5842             goto thats_all_folks;
5843     }
5844
5845 thats_all_folks:
5846     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
5847           memNE((char*)bp - rslen, rsptr, rslen))
5848         goto screamer;                          /* go back to the fray */
5849 thats_really_all_folks:
5850     if (shortbuffered)
5851         cnt += shortbuffered;
5852         DEBUG_P(PerlIO_printf(Perl_debug_log,
5853             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5854     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
5855     DEBUG_P(PerlIO_printf(Perl_debug_log,
5856         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5857         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5858         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5859     *bp = '\0';
5860     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
5861     DEBUG_P(PerlIO_printf(Perl_debug_log,
5862         "Screamer: done, len=%ld, string=|%.*s|\n",
5863         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
5864     }
5865    else
5866     {
5867        /*The big, slow, and stupid way. */
5868 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
5869         STDCHAR *buf = 0;
5870         Newx(buf, 8192, STDCHAR);
5871         assert(buf);
5872 #else
5873         STDCHAR buf[8192];
5874 #endif
5875
5876 screamer2:
5877         if (rslen) {
5878             register const STDCHAR * const bpe = buf + sizeof(buf);
5879             bp = buf;
5880             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
5881                 ; /* keep reading */
5882             cnt = bp - buf;
5883         }
5884         else {
5885             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
5886             /* Accomodate broken VAXC compiler, which applies U8 cast to
5887              * both args of ?: operator, causing EOF to change into 255
5888              */
5889             if (cnt > 0)
5890                  i = (U8)buf[cnt - 1];
5891             else
5892                  i = EOF;
5893         }
5894
5895         if (cnt < 0)
5896             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
5897         if (append)
5898              sv_catpvn(sv, (char *) buf, cnt);
5899         else
5900              sv_setpvn(sv, (char *) buf, cnt);
5901
5902         if (i != EOF &&                 /* joy */
5903             (!rslen ||
5904              SvCUR(sv) < rslen ||
5905              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
5906         {
5907             append = -1;
5908             /*
5909              * If we're reading from a TTY and we get a short read,
5910              * indicating that the user hit his EOF character, we need
5911              * to notice it now, because if we try to read from the TTY
5912              * again, the EOF condition will disappear.
5913              *
5914              * The comparison of cnt to sizeof(buf) is an optimization
5915              * that prevents unnecessary calls to feof().
5916              *
5917              * - jik 9/25/96
5918              */
5919             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
5920                 goto screamer2;
5921         }
5922
5923 #ifdef USE_HEAP_INSTEAD_OF_STACK
5924         Safefree(buf);
5925 #endif
5926     }
5927
5928     if (rspara) {               /* have to do this both before and after */
5929         while (i != EOF) {      /* to make sure file boundaries work right */
5930             i = PerlIO_getc(fp);
5931             if (i != '\n') {
5932                 PerlIO_ungetc(fp,i);
5933                 break;
5934             }
5935         }
5936     }
5937
5938 return_string_or_null:
5939     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
5940 }
5941
5942 /*
5943 =for apidoc sv_inc
5944
5945 Auto-increment of the value in the SV, doing string to numeric conversion
5946 if necessary. Handles 'get' magic.
5947
5948 =cut
5949 */
5950
5951 void
5952 Perl_sv_inc(pTHX_ register SV *sv)
5953 {
5954     register char *d;
5955     int flags;
5956
5957     if (!sv)
5958         return;
5959     SvGETMAGIC(sv);
5960     if (SvTHINKFIRST(sv)) {
5961         if (SvIsCOW(sv))
5962             sv_force_normal_flags(sv, 0);
5963         if (SvREADONLY(sv)) {
5964             if (IN_PERL_RUNTIME)
5965                 Perl_croak(aTHX_ PL_no_modify);
5966         }
5967         if (SvROK(sv)) {
5968             IV i;
5969             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
5970                 return;
5971             i = PTR2IV(SvRV(sv));
5972             sv_unref(sv);
5973             sv_setiv(sv, i);
5974         }
5975     }
5976     flags = SvFLAGS(sv);
5977     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
5978         /* It's (privately or publicly) a float, but not tested as an
5979            integer, so test it to see. */
5980         (void) SvIV(sv);
5981         flags = SvFLAGS(sv);
5982     }
5983     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
5984         /* It's publicly an integer, or privately an integer-not-float */
5985 #ifdef PERL_PRESERVE_IVUV
5986       oops_its_int:
5987 #endif
5988         if (SvIsUV(sv)) {
5989             if (SvUVX(sv) == UV_MAX)
5990                 sv_setnv(sv, UV_MAX_P1);
5991             else
5992                 (void)SvIOK_only_UV(sv);
5993                 SvUV_set(sv, SvUVX(sv) + 1);
5994         } else {
5995             if (SvIVX(sv) == IV_MAX)
5996                 sv_setuv(sv, (UV)IV_MAX + 1);
5997             else {
5998                 (void)SvIOK_only(sv);
5999                 SvIV_set(sv, SvIVX(sv) + 1);
6000             }   
6001         }
6002         return;
6003     }
6004     if (flags & SVp_NOK) {
6005         (void)SvNOK_only(sv);
6006         SvNV_set(sv, SvNVX(sv) + 1.0);
6007         return;
6008     }
6009
6010     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6011         if ((flags & SVTYPEMASK) < SVt_PVIV)
6012             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6013         (void)SvIOK_only(sv);
6014         SvIV_set(sv, 1);
6015         return;
6016     }
6017     d = SvPVX(sv);
6018     while (isALPHA(*d)) d++;
6019     while (isDIGIT(*d)) d++;
6020     if (*d) {
6021 #ifdef PERL_PRESERVE_IVUV
6022         /* Got to punt this as an integer if needs be, but we don't issue
6023            warnings. Probably ought to make the sv_iv_please() that does
6024            the conversion if possible, and silently.  */
6025         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6026         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6027             /* Need to try really hard to see if it's an integer.
6028                9.22337203685478e+18 is an integer.
6029                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6030                so $a="9.22337203685478e+18"; $a+0; $a++
6031                needs to be the same as $a="9.22337203685478e+18"; $a++
6032                or we go insane. */
6033         
6034             (void) sv_2iv(sv);
6035             if (SvIOK(sv))
6036                 goto oops_its_int;
6037
6038             /* sv_2iv *should* have made this an NV */
6039             if (flags & SVp_NOK) {
6040                 (void)SvNOK_only(sv);
6041                 SvNV_set(sv, SvNVX(sv) + 1.0);
6042                 return;
6043             }
6044             /* I don't think we can get here. Maybe I should assert this
6045                And if we do get here I suspect that sv_setnv will croak. NWC
6046                Fall through. */
6047 #if defined(USE_LONG_DOUBLE)
6048             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6049                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6050 #else
6051             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6052                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6053 #endif
6054         }
6055 #endif /* PERL_PRESERVE_IVUV */
6056         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6057         return;
6058     }
6059     d--;
6060     while (d >= SvPVX_const(sv)) {
6061         if (isDIGIT(*d)) {
6062             if (++*d <= '9')
6063                 return;
6064             *(d--) = '0';
6065         }
6066         else {
6067 #ifdef EBCDIC
6068             /* MKS: The original code here died if letters weren't consecutive.
6069              * at least it didn't have to worry about non-C locales.  The
6070              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6071              * arranged in order (although not consecutively) and that only
6072              * [A-Za-z] are accepted by isALPHA in the C locale.
6073              */
6074             if (*d != 'z' && *d != 'Z') {
6075                 do { ++*d; } while (!isALPHA(*d));
6076                 return;
6077             }
6078             *(d--) -= 'z' - 'a';
6079 #else
6080             ++*d;
6081             if (isALPHA(*d))
6082                 return;
6083             *(d--) -= 'z' - 'a' + 1;
6084 #endif
6085         }
6086     }
6087     /* oh,oh, the number grew */
6088     SvGROW(sv, SvCUR(sv) + 2);
6089     SvCUR_set(sv, SvCUR(sv) + 1);
6090     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6091         *d = d[-1];
6092     if (isDIGIT(d[1]))
6093         *d = '1';
6094     else
6095         *d = d[1];
6096 }
6097
6098 /*
6099 =for apidoc sv_dec
6100
6101 Auto-decrement of the value in the SV, doing string to numeric conversion
6102 if necessary. Handles 'get' magic.
6103
6104 =cut
6105 */
6106
6107 void
6108 Perl_sv_dec(pTHX_ register SV *sv)
6109 {
6110     int flags;
6111
6112     if (!sv)
6113         return;
6114     SvGETMAGIC(sv);
6115     if (SvTHINKFIRST(sv)) {
6116         if (SvIsCOW(sv))
6117             sv_force_normal_flags(sv, 0);
6118         if (SvREADONLY(sv)) {
6119             if (IN_PERL_RUNTIME)
6120                 Perl_croak(aTHX_ PL_no_modify);
6121         }
6122         if (SvROK(sv)) {
6123             IV i;
6124             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6125                 return;
6126             i = PTR2IV(SvRV(sv));
6127             sv_unref(sv);
6128             sv_setiv(sv, i);
6129         }
6130     }
6131     /* Unlike sv_inc we don't have to worry about string-never-numbers
6132        and keeping them magic. But we mustn't warn on punting */
6133     flags = SvFLAGS(sv);
6134     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6135         /* It's publicly an integer, or privately an integer-not-float */
6136 #ifdef PERL_PRESERVE_IVUV
6137       oops_its_int:
6138 #endif
6139         if (SvIsUV(sv)) {
6140             if (SvUVX(sv) == 0) {
6141                 (void)SvIOK_only(sv);
6142                 SvIV_set(sv, -1);
6143             }
6144             else {
6145                 (void)SvIOK_only_UV(sv);
6146                 SvUV_set(sv, SvUVX(sv) - 1);
6147             }   
6148         } else {
6149             if (SvIVX(sv) == IV_MIN)
6150                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6151             else {
6152                 (void)SvIOK_only(sv);
6153                 SvIV_set(sv, SvIVX(sv) - 1);
6154             }   
6155         }
6156         return;
6157     }
6158     if (flags & SVp_NOK) {
6159         SvNV_set(sv, SvNVX(sv) - 1.0);
6160         (void)SvNOK_only(sv);
6161         return;
6162     }
6163     if (!(flags & SVp_POK)) {
6164         if ((flags & SVTYPEMASK) < SVt_PVIV)
6165             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6166         SvIV_set(sv, -1);
6167         (void)SvIOK_only(sv);
6168         return;
6169     }
6170 #ifdef PERL_PRESERVE_IVUV
6171     {
6172         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6173         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6174             /* Need to try really hard to see if it's an integer.
6175                9.22337203685478e+18 is an integer.
6176                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6177                so $a="9.22337203685478e+18"; $a+0; $a--
6178                needs to be the same as $a="9.22337203685478e+18"; $a--
6179                or we go insane. */
6180         
6181             (void) sv_2iv(sv);
6182             if (SvIOK(sv))
6183                 goto oops_its_int;
6184
6185             /* sv_2iv *should* have made this an NV */
6186             if (flags & SVp_NOK) {
6187                 (void)SvNOK_only(sv);
6188                 SvNV_set(sv, SvNVX(sv) - 1.0);
6189                 return;
6190             }
6191             /* I don't think we can get here. Maybe I should assert this
6192                And if we do get here I suspect that sv_setnv will croak. NWC
6193                Fall through. */
6194 #if defined(USE_LONG_DOUBLE)
6195             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6196                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6197 #else
6198             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6199                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6200 #endif
6201         }
6202     }
6203 #endif /* PERL_PRESERVE_IVUV */
6204     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6205 }
6206
6207 /*
6208 =for apidoc sv_mortalcopy
6209
6210 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6211 The new SV is marked as mortal. It will be destroyed "soon", either by an
6212 explicit call to FREETMPS, or by an implicit call at places such as
6213 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6214
6215 =cut
6216 */
6217
6218 /* Make a string that will exist for the duration of the expression
6219  * evaluation.  Actually, it may have to last longer than that, but
6220  * hopefully we won't free it until it has been assigned to a
6221  * permanent location. */
6222
6223 SV *
6224 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6225 {
6226     register SV *sv;
6227
6228     new_SV(sv);
6229     sv_setsv(sv,oldstr);
6230     EXTEND_MORTAL(1);
6231     PL_tmps_stack[++PL_tmps_ix] = sv;
6232     SvTEMP_on(sv);
6233     return sv;
6234 }
6235
6236 /*
6237 =for apidoc sv_newmortal
6238
6239 Creates a new null SV which is mortal.  The reference count of the SV is
6240 set to 1. It will be destroyed "soon", either by an explicit call to
6241 FREETMPS, or by an implicit call at places such as statement boundaries.
6242 See also C<sv_mortalcopy> and C<sv_2mortal>.
6243
6244 =cut
6245 */
6246
6247 SV *
6248 Perl_sv_newmortal(pTHX)
6249 {
6250     register SV *sv;
6251
6252     new_SV(sv);
6253     SvFLAGS(sv) = SVs_TEMP;
6254     EXTEND_MORTAL(1);
6255     PL_tmps_stack[++PL_tmps_ix] = sv;
6256     return sv;
6257 }
6258
6259 /*
6260 =for apidoc sv_2mortal
6261
6262 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6263 by an explicit call to FREETMPS, or by an implicit call at places such as
6264 statement boundaries.  SvTEMP() is turned on which means that the SV's
6265 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6266 and C<sv_mortalcopy>.
6267
6268 =cut
6269 */
6270
6271 SV *
6272 Perl_sv_2mortal(pTHX_ register SV *sv)
6273 {
6274     dVAR;
6275     if (!sv)
6276         return sv;
6277     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6278         return sv;
6279     EXTEND_MORTAL(1);
6280     PL_tmps_stack[++PL_tmps_ix] = sv;
6281     SvTEMP_on(sv);
6282     return sv;
6283 }
6284
6285 /*
6286 =for apidoc newSVpv
6287
6288 Creates a new SV and copies a string into it.  The reference count for the
6289 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6290 strlen().  For efficiency, consider using C<newSVpvn> instead.
6291
6292 =cut
6293 */
6294
6295 SV *
6296 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6297 {
6298     register SV *sv;
6299
6300     new_SV(sv);
6301     sv_setpvn(sv,s,len ? len : strlen(s));
6302     return sv;
6303 }
6304
6305 /*
6306 =for apidoc newSVpvn
6307
6308 Creates a new SV and copies a string into it.  The reference count for the
6309 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6310 string.  You are responsible for ensuring that the source string is at least
6311 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6312
6313 =cut
6314 */
6315
6316 SV *
6317 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6318 {
6319     register SV *sv;
6320
6321     new_SV(sv);
6322     sv_setpvn(sv,s,len);
6323     return sv;
6324 }
6325
6326
6327 /*
6328 =for apidoc newSVhek
6329
6330 Creates a new SV from the hash key structure.  It will generate scalars that
6331 point to the shared string table where possible. Returns a new (undefined)
6332 SV if the hek is NULL.
6333
6334 =cut
6335 */
6336
6337 SV *
6338 Perl_newSVhek(pTHX_ const HEK *hek)
6339 {
6340     if (!hek) {
6341         SV *sv;
6342
6343         new_SV(sv);
6344         return sv;
6345     }
6346
6347     if (HEK_LEN(hek) == HEf_SVKEY) {
6348         return newSVsv(*(SV**)HEK_KEY(hek));
6349     } else {
6350         const int flags = HEK_FLAGS(hek);
6351         if (flags & HVhek_WASUTF8) {
6352             /* Trouble :-)
6353                Andreas would like keys he put in as utf8 to come back as utf8
6354             */
6355             STRLEN utf8_len = HEK_LEN(hek);
6356             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6357             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6358
6359             SvUTF8_on (sv);
6360             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6361             return sv;
6362         } else if (flags & HVhek_REHASH) {
6363             /* We don't have a pointer to the hv, so we have to replicate the
6364                flag into every HEK. This hv is using custom a hasing
6365                algorithm. Hence we can't return a shared string scalar, as
6366                that would contain the (wrong) hash value, and might get passed
6367                into an hv routine with a regular hash  */
6368
6369             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6370             if (HEK_UTF8(hek))
6371                 SvUTF8_on (sv);
6372             return sv;
6373         }
6374         /* This will be overwhelminly the most common case.  */
6375         return newSVpvn_share(HEK_KEY(hek),
6376                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6377                               HEK_HASH(hek));
6378     }
6379 }
6380
6381 /*
6382 =for apidoc newSVpvn_share
6383
6384 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6385 table. If the string does not already exist in the table, it is created
6386 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6387 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6388 otherwise the hash is computed.  The idea here is that as the string table
6389 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6390 hash lookup will avoid string compare.
6391
6392 =cut
6393 */
6394
6395 SV *
6396 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6397 {
6398     register SV *sv;
6399     bool is_utf8 = FALSE;
6400     if (len < 0) {
6401         STRLEN tmplen = -len;
6402         is_utf8 = TRUE;
6403         /* See the note in hv.c:hv_fetch() --jhi */
6404         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6405         len = tmplen;
6406     }
6407     if (!hash)
6408         PERL_HASH(hash, src, len);
6409     new_SV(sv);
6410     sv_upgrade(sv, SVt_PV);
6411     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6412     SvCUR_set(sv, len);
6413     SvLEN_set(sv, 0);
6414     SvREADONLY_on(sv);
6415     SvFAKE_on(sv);
6416     SvPOK_on(sv);
6417     if (is_utf8)
6418         SvUTF8_on(sv);
6419     return sv;
6420 }
6421
6422
6423 #if defined(PERL_IMPLICIT_CONTEXT)
6424
6425 /* pTHX_ magic can't cope with varargs, so this is a no-context
6426  * version of the main function, (which may itself be aliased to us).
6427  * Don't access this version directly.
6428  */
6429
6430 SV *
6431 Perl_newSVpvf_nocontext(const char* pat, ...)
6432 {
6433     dTHX;
6434     register SV *sv;
6435     va_list args;
6436     va_start(args, pat);
6437     sv = vnewSVpvf(pat, &args);
6438     va_end(args);
6439     return sv;
6440 }
6441 #endif
6442
6443 /*
6444 =for apidoc newSVpvf
6445
6446 Creates a new SV and initializes it with the string formatted like
6447 C<sprintf>.
6448
6449 =cut
6450 */
6451
6452 SV *
6453 Perl_newSVpvf(pTHX_ const char* pat, ...)
6454 {
6455     register SV *sv;
6456     va_list args;
6457     va_start(args, pat);
6458     sv = vnewSVpvf(pat, &args);
6459     va_end(args);
6460     return sv;
6461 }
6462
6463 /* backend for newSVpvf() and newSVpvf_nocontext() */
6464
6465 SV *
6466 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6467 {
6468     register SV *sv;
6469     new_SV(sv);
6470     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6471     return sv;
6472 }
6473
6474 /*
6475 =for apidoc newSVnv
6476
6477 Creates a new SV and copies a floating point value into it.
6478 The reference count for the SV is set to 1.
6479
6480 =cut
6481 */
6482
6483 SV *
6484 Perl_newSVnv(pTHX_ NV n)
6485 {
6486     register SV *sv;
6487
6488     new_SV(sv);
6489     sv_setnv(sv,n);
6490     return sv;
6491 }
6492
6493 /*
6494 =for apidoc newSViv
6495
6496 Creates a new SV and copies an integer into it.  The reference count for the
6497 SV is set to 1.
6498
6499 =cut
6500 */
6501
6502 SV *
6503 Perl_newSViv(pTHX_ IV i)
6504 {
6505     register SV *sv;
6506
6507     new_SV(sv);
6508     sv_setiv(sv,i);
6509     return sv;
6510 }
6511
6512 /*
6513 =for apidoc newSVuv
6514
6515 Creates a new SV and copies an unsigned integer into it.
6516 The reference count for the SV is set to 1.
6517
6518 =cut
6519 */
6520
6521 SV *
6522 Perl_newSVuv(pTHX_ UV u)
6523 {
6524     register SV *sv;
6525
6526     new_SV(sv);
6527     sv_setuv(sv,u);
6528     return sv;
6529 }
6530
6531 /*
6532 =for apidoc newRV_noinc
6533
6534 Creates an RV wrapper for an SV.  The reference count for the original
6535 SV is B<not> incremented.
6536
6537 =cut
6538 */
6539
6540 SV *
6541 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6542 {
6543     register SV *sv;
6544
6545     new_SV(sv);
6546     sv_upgrade(sv, SVt_RV);
6547     SvTEMP_off(tmpRef);
6548     SvRV_set(sv, tmpRef);
6549     SvROK_on(sv);
6550     return sv;
6551 }
6552
6553 /* newRV_inc is the official function name to use now.
6554  * newRV_inc is in fact #defined to newRV in sv.h
6555  */
6556
6557 SV *
6558 Perl_newRV(pTHX_ SV *tmpRef)
6559 {
6560     return newRV_noinc(SvREFCNT_inc(tmpRef));
6561 }
6562
6563 /*
6564 =for apidoc newSVsv
6565
6566 Creates a new SV which is an exact duplicate of the original SV.
6567 (Uses C<sv_setsv>).
6568
6569 =cut
6570 */
6571
6572 SV *
6573 Perl_newSVsv(pTHX_ register SV *old)
6574 {
6575     register SV *sv;
6576
6577     if (!old)
6578         return Nullsv;
6579     if (SvTYPE(old) == SVTYPEMASK) {
6580         if (ckWARN_d(WARN_INTERNAL))
6581             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6582         return Nullsv;
6583     }
6584     new_SV(sv);
6585     /* SV_GMAGIC is the default for sv_setv()
6586        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6587        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6588     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6589     return sv;
6590 }
6591
6592 /*
6593 =for apidoc sv_reset
6594
6595 Underlying implementation for the C<reset> Perl function.
6596 Note that the perl-level function is vaguely deprecated.
6597
6598 =cut
6599 */
6600
6601 void
6602 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6603 {
6604     dVAR;
6605     char todo[PERL_UCHAR_MAX+1];
6606
6607     if (!stash)
6608         return;
6609
6610     if (!*s) {          /* reset ?? searches */
6611         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6612         if (mg) {
6613             PMOP *pm = (PMOP *) mg->mg_obj;
6614             while (pm) {
6615                 pm->op_pmdynflags &= ~PMdf_USED;
6616                 pm = pm->op_pmnext;
6617             }
6618         }
6619         return;
6620     }
6621
6622     /* reset variables */
6623
6624     if (!HvARRAY(stash))
6625         return;
6626
6627     Zero(todo, 256, char);
6628     while (*s) {
6629         I32 max;
6630         I32 i = (unsigned char)*s;
6631         if (s[1] == '-') {
6632             s += 2;
6633         }
6634         max = (unsigned char)*s++;
6635         for ( ; i <= max; i++) {
6636             todo[i] = 1;
6637         }
6638         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6639             HE *entry;
6640             for (entry = HvARRAY(stash)[i];
6641                  entry;
6642                  entry = HeNEXT(entry))
6643             {
6644                 register GV *gv;
6645                 register SV *sv;
6646
6647                 if (!todo[(U8)*HeKEY(entry)])
6648                     continue;
6649                 gv = (GV*)HeVAL(entry);
6650                 sv = GvSV(gv);
6651                 if (sv) {
6652                     if (SvTHINKFIRST(sv)) {
6653                         if (!SvREADONLY(sv) && SvROK(sv))
6654                             sv_unref(sv);
6655                         /* XXX Is this continue a bug? Why should THINKFIRST
6656                            exempt us from resetting arrays and hashes?  */
6657                         continue;
6658                     }
6659                     SvOK_off(sv);
6660                     if (SvTYPE(sv) >= SVt_PV) {
6661                         SvCUR_set(sv, 0);
6662                         if (SvPVX_const(sv) != Nullch)
6663                             *SvPVX(sv) = '\0';
6664                         SvTAINT(sv);
6665                     }
6666                 }
6667                 if (GvAV(gv)) {
6668                     av_clear(GvAV(gv));
6669                 }
6670                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6671 #if defined(VMS)
6672                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6673 #else /* ! VMS */
6674                     hv_clear(GvHV(gv));
6675 #  if defined(USE_ENVIRON_ARRAY)
6676                     if (gv == PL_envgv)
6677                         my_clearenv();
6678 #  endif /* USE_ENVIRON_ARRAY */
6679 #endif /* VMS */
6680                 }
6681             }
6682         }
6683     }
6684 }
6685
6686 /*
6687 =for apidoc sv_2io
6688
6689 Using various gambits, try to get an IO from an SV: the IO slot if its a
6690 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6691 named after the PV if we're a string.
6692
6693 =cut
6694 */
6695
6696 IO*
6697 Perl_sv_2io(pTHX_ SV *sv)
6698 {
6699     IO* io;
6700     GV* gv;
6701
6702     switch (SvTYPE(sv)) {
6703     case SVt_PVIO:
6704         io = (IO*)sv;
6705         break;
6706     case SVt_PVGV:
6707         gv = (GV*)sv;
6708         io = GvIO(gv);
6709         if (!io)
6710             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6711         break;
6712     default:
6713         if (!SvOK(sv))
6714             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6715         if (SvROK(sv))
6716             return sv_2io(SvRV(sv));
6717         gv = gv_fetchsv(sv, FALSE, SVt_PVIO);
6718         if (gv)
6719             io = GvIO(gv);
6720         else
6721             io = 0;
6722         if (!io)
6723             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6724         break;
6725     }
6726     return io;
6727 }
6728
6729 /*
6730 =for apidoc sv_2cv
6731
6732 Using various gambits, try to get a CV from an SV; in addition, try if
6733 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6734
6735 =cut
6736 */
6737
6738 CV *
6739 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6740 {
6741     dVAR;
6742     GV *gv = Nullgv;
6743     CV *cv = Nullcv;
6744
6745     if (!sv)
6746         return *gvp = Nullgv, Nullcv;
6747     switch (SvTYPE(sv)) {
6748     case SVt_PVCV:
6749         *st = CvSTASH(sv);
6750         *gvp = Nullgv;
6751         return (CV*)sv;
6752     case SVt_PVHV:
6753     case SVt_PVAV:
6754         *gvp = Nullgv;
6755         return Nullcv;
6756     case SVt_PVGV:
6757         gv = (GV*)sv;
6758         *gvp = gv;
6759         *st = GvESTASH(gv);
6760         goto fix_gv;
6761
6762     default:
6763         SvGETMAGIC(sv);
6764         if (SvROK(sv)) {
6765             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6766             tryAMAGICunDEREF(to_cv);
6767
6768             sv = SvRV(sv);
6769             if (SvTYPE(sv) == SVt_PVCV) {
6770                 cv = (CV*)sv;
6771                 *gvp = Nullgv;
6772                 *st = CvSTASH(cv);
6773                 return cv;
6774             }
6775             else if(isGV(sv))
6776                 gv = (GV*)sv;
6777             else
6778                 Perl_croak(aTHX_ "Not a subroutine reference");
6779         }
6780         else if (isGV(sv))
6781             gv = (GV*)sv;
6782         else
6783             gv = gv_fetchsv(sv, lref, SVt_PVCV);
6784         *gvp = gv;
6785         if (!gv)
6786             return Nullcv;
6787         *st = GvESTASH(gv);
6788     fix_gv:
6789         if (lref && !GvCVu(gv)) {
6790             SV *tmpsv;
6791             ENTER;
6792             tmpsv = NEWSV(704,0);
6793             gv_efullname3(tmpsv, gv, Nullch);
6794             /* XXX this is probably not what they think they're getting.
6795              * It has the same effect as "sub name;", i.e. just a forward
6796              * declaration! */
6797             newSUB(start_subparse(FALSE, 0),
6798                    newSVOP(OP_CONST, 0, tmpsv),
6799                    Nullop,
6800                    Nullop);
6801             LEAVE;
6802             if (!GvCVu(gv))
6803                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
6804                            sv);
6805         }
6806         return GvCVu(gv);
6807     }
6808 }
6809
6810 /*
6811 =for apidoc sv_true
6812
6813 Returns true if the SV has a true value by Perl's rules.
6814 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
6815 instead use an in-line version.
6816
6817 =cut
6818 */
6819
6820 I32
6821 Perl_sv_true(pTHX_ register SV *sv)
6822 {
6823     if (!sv)
6824         return 0;
6825     if (SvPOK(sv)) {
6826         register const XPV* const tXpv = (XPV*)SvANY(sv);
6827         if (tXpv &&
6828                 (tXpv->xpv_cur > 1 ||
6829                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
6830             return 1;
6831         else
6832             return 0;
6833     }
6834     else {
6835         if (SvIOK(sv))
6836             return SvIVX(sv) != 0;
6837         else {
6838             if (SvNOK(sv))
6839                 return SvNVX(sv) != 0.0;
6840             else
6841                 return sv_2bool(sv);
6842         }
6843     }
6844 }
6845
6846 /*
6847 =for apidoc sv_pvn_force
6848
6849 Get a sensible string out of the SV somehow.
6850 A private implementation of the C<SvPV_force> macro for compilers which
6851 can't cope with complex macro expressions. Always use the macro instead.
6852
6853 =for apidoc sv_pvn_force_flags
6854
6855 Get a sensible string out of the SV somehow.
6856 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
6857 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
6858 implemented in terms of this function.
6859 You normally want to use the various wrapper macros instead: see
6860 C<SvPV_force> and C<SvPV_force_nomg>
6861
6862 =cut
6863 */
6864
6865 char *
6866 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
6867 {
6868
6869     if (SvTHINKFIRST(sv) && !SvROK(sv))
6870         sv_force_normal_flags(sv, 0);
6871
6872     if (SvPOK(sv)) {
6873         if (lp)
6874             *lp = SvCUR(sv);
6875     }
6876     else {
6877         char *s;
6878         STRLEN len;
6879  
6880         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
6881             const char * const ref = sv_reftype(sv,0);
6882             if (PL_op)
6883                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
6884                            ref, OP_NAME(PL_op));
6885             else
6886                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
6887         }
6888         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
6889             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
6890                 OP_NAME(PL_op));
6891         s = sv_2pv_flags(sv, &len, flags);
6892         if (lp)
6893             *lp = len;
6894
6895         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
6896             if (SvROK(sv))
6897                 sv_unref(sv);
6898             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
6899             SvGROW(sv, len + 1);
6900             Move(s,SvPVX(sv),len,char);
6901             SvCUR_set(sv, len);
6902             *SvEND(sv) = '\0';
6903         }
6904         if (!SvPOK(sv)) {
6905             SvPOK_on(sv);               /* validate pointer */
6906             SvTAINT(sv);
6907             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
6908                                   PTR2UV(sv),SvPVX_const(sv)));
6909         }
6910     }
6911     return SvPVX_mutable(sv);
6912 }
6913
6914 /*
6915 =for apidoc sv_pvbyten_force
6916
6917 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
6918
6919 =cut
6920 */
6921
6922 char *
6923 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
6924 {
6925     sv_pvn_force(sv,lp);
6926     sv_utf8_downgrade(sv,0);
6927     *lp = SvCUR(sv);
6928     return SvPVX(sv);
6929 }
6930
6931 /*
6932 =for apidoc sv_pvutf8n_force
6933
6934 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
6935
6936 =cut
6937 */
6938
6939 char *
6940 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
6941 {
6942     sv_pvn_force(sv,lp);
6943     sv_utf8_upgrade(sv);
6944     *lp = SvCUR(sv);
6945     return SvPVX(sv);
6946 }
6947
6948 /*
6949 =for apidoc sv_reftype
6950
6951 Returns a string describing what the SV is a reference to.
6952
6953 =cut
6954 */
6955
6956 char *
6957 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
6958 {
6959     /* The fact that I don't need to downcast to char * everywhere, only in ?:
6960        inside return suggests a const propagation bug in g++.  */
6961     if (ob && SvOBJECT(sv)) {
6962         char * const name = HvNAME_get(SvSTASH(sv));
6963         return name ? name : (char *) "__ANON__";
6964     }
6965     else {
6966         switch (SvTYPE(sv)) {
6967         case SVt_NULL:
6968         case SVt_IV:
6969         case SVt_NV:
6970         case SVt_RV:
6971         case SVt_PV:
6972         case SVt_PVIV:
6973         case SVt_PVNV:
6974         case SVt_PVMG:
6975         case SVt_PVBM:
6976                                 if (SvVOK(sv))
6977                                     return "VSTRING";
6978                                 if (SvROK(sv))
6979                                     return "REF";
6980                                 else
6981                                     return "SCALAR";
6982
6983         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
6984                                 /* tied lvalues should appear to be
6985                                  * scalars for backwards compatitbility */
6986                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
6987                                     ? "SCALAR" : "LVALUE");
6988         case SVt_PVAV:          return "ARRAY";
6989         case SVt_PVHV:          return "HASH";
6990         case SVt_PVCV:          return "CODE";
6991         case SVt_PVGV:          return "GLOB";
6992         case SVt_PVFM:          return "FORMAT";
6993         case SVt_PVIO:          return "IO";
6994         default:                return "UNKNOWN";
6995         }
6996     }
6997 }
6998
6999 /*
7000 =for apidoc sv_isobject
7001
7002 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7003 object.  If the SV is not an RV, or if the object is not blessed, then this
7004 will return false.
7005
7006 =cut
7007 */
7008
7009 int
7010 Perl_sv_isobject(pTHX_ SV *sv)
7011 {
7012     if (!sv)
7013         return 0;
7014     SvGETMAGIC(sv);
7015     if (!SvROK(sv))
7016         return 0;
7017     sv = (SV*)SvRV(sv);
7018     if (!SvOBJECT(sv))
7019         return 0;
7020     return 1;
7021 }
7022
7023 /*
7024 =for apidoc sv_isa
7025
7026 Returns a boolean indicating whether the SV is blessed into the specified
7027 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7028 an inheritance relationship.
7029
7030 =cut
7031 */
7032
7033 int
7034 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7035 {
7036     const char *hvname;
7037     if (!sv)
7038         return 0;
7039     SvGETMAGIC(sv);
7040     if (!SvROK(sv))
7041         return 0;
7042     sv = (SV*)SvRV(sv);
7043     if (!SvOBJECT(sv))
7044         return 0;
7045     hvname = HvNAME_get(SvSTASH(sv));
7046     if (!hvname)
7047         return 0;
7048
7049     return strEQ(hvname, name);
7050 }
7051
7052 /*
7053 =for apidoc newSVrv
7054
7055 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7056 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7057 be blessed in the specified package.  The new SV is returned and its
7058 reference count is 1.
7059
7060 =cut
7061 */
7062
7063 SV*
7064 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7065 {
7066     SV *sv;
7067
7068     new_SV(sv);
7069
7070     SV_CHECK_THINKFIRST_COW_DROP(rv);
7071     SvAMAGIC_off(rv);
7072
7073     if (SvTYPE(rv) >= SVt_PVMG) {
7074         const U32 refcnt = SvREFCNT(rv);
7075         SvREFCNT(rv) = 0;
7076         sv_clear(rv);
7077         SvFLAGS(rv) = 0;
7078         SvREFCNT(rv) = refcnt;
7079     }
7080
7081     if (SvTYPE(rv) < SVt_RV)
7082         sv_upgrade(rv, SVt_RV);
7083     else if (SvTYPE(rv) > SVt_RV) {
7084         SvPV_free(rv);
7085         SvCUR_set(rv, 0);
7086         SvLEN_set(rv, 0);
7087     }
7088
7089     SvOK_off(rv);
7090     SvRV_set(rv, sv);
7091     SvROK_on(rv);
7092
7093     if (classname) {
7094         HV* const stash = gv_stashpv(classname, TRUE);
7095         (void)sv_bless(rv, stash);
7096     }
7097     return sv;
7098 }
7099
7100 /*
7101 =for apidoc sv_setref_pv
7102
7103 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7104 argument will be upgraded to an RV.  That RV will be modified to point to
7105 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7106 into the SV.  The C<classname> argument indicates the package for the
7107 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7108 will have a reference count of 1, and the RV will be returned.
7109
7110 Do not use with other Perl types such as HV, AV, SV, CV, because those
7111 objects will become corrupted by the pointer copy process.
7112
7113 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7114
7115 =cut
7116 */
7117
7118 SV*
7119 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7120 {
7121     if (!pv) {
7122         sv_setsv(rv, &PL_sv_undef);
7123         SvSETMAGIC(rv);
7124     }
7125     else
7126         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7127     return rv;
7128 }
7129
7130 /*
7131 =for apidoc sv_setref_iv
7132
7133 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7134 argument will be upgraded to an RV.  That RV will be modified to point to
7135 the new SV.  The C<classname> argument indicates the package for the
7136 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7137 will have a reference count of 1, and the RV will be returned.
7138
7139 =cut
7140 */
7141
7142 SV*
7143 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7144 {
7145     sv_setiv(newSVrv(rv,classname), iv);
7146     return rv;
7147 }
7148
7149 /*
7150 =for apidoc sv_setref_uv
7151
7152 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7153 argument will be upgraded to an RV.  That RV will be modified to point to
7154 the new SV.  The C<classname> argument indicates the package for the
7155 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7156 will have a reference count of 1, and the RV will be returned.
7157
7158 =cut
7159 */
7160
7161 SV*
7162 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7163 {
7164     sv_setuv(newSVrv(rv,classname), uv);
7165     return rv;
7166 }
7167
7168 /*
7169 =for apidoc sv_setref_nv
7170
7171 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7172 argument will be upgraded to an RV.  That RV will be modified to point to
7173 the new SV.  The C<classname> argument indicates the package for the
7174 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7175 will have a reference count of 1, and the RV will be returned.
7176
7177 =cut
7178 */
7179
7180 SV*
7181 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7182 {
7183     sv_setnv(newSVrv(rv,classname), nv);
7184     return rv;
7185 }
7186
7187 /*
7188 =for apidoc sv_setref_pvn
7189
7190 Copies a string into a new SV, optionally blessing the SV.  The length of the
7191 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7192 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7193 argument indicates the package for the blessing.  Set C<classname> to
7194 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7195 of 1, and the RV will be returned.
7196
7197 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7198
7199 =cut
7200 */
7201
7202 SV*
7203 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7204 {
7205     sv_setpvn(newSVrv(rv,classname), pv, n);
7206     return rv;
7207 }
7208
7209 /*
7210 =for apidoc sv_bless
7211
7212 Blesses an SV into a specified package.  The SV must be an RV.  The package
7213 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7214 of the SV is unaffected.
7215
7216 =cut
7217 */
7218
7219 SV*
7220 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7221 {
7222     SV *tmpRef;
7223     if (!SvROK(sv))
7224         Perl_croak(aTHX_ "Can't bless non-reference value");
7225     tmpRef = SvRV(sv);
7226     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7227         if (SvREADONLY(tmpRef))
7228             Perl_croak(aTHX_ PL_no_modify);
7229         if (SvOBJECT(tmpRef)) {
7230             if (SvTYPE(tmpRef) != SVt_PVIO)
7231                 --PL_sv_objcount;
7232             SvREFCNT_dec(SvSTASH(tmpRef));
7233         }
7234     }
7235     SvOBJECT_on(tmpRef);
7236     if (SvTYPE(tmpRef) != SVt_PVIO)
7237         ++PL_sv_objcount;
7238     SvUPGRADE(tmpRef, SVt_PVMG);
7239     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7240
7241     if (Gv_AMG(stash))
7242         SvAMAGIC_on(sv);
7243     else
7244         SvAMAGIC_off(sv);
7245
7246     if(SvSMAGICAL(tmpRef))
7247         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7248             mg_set(tmpRef);
7249
7250
7251
7252     return sv;
7253 }
7254
7255 /* Downgrades a PVGV to a PVMG.
7256  */
7257
7258 STATIC void
7259 S_sv_unglob(pTHX_ SV *sv)
7260 {
7261     void *xpvmg;
7262
7263     assert(SvTYPE(sv) == SVt_PVGV);
7264     SvFAKE_off(sv);
7265     if (GvGP(sv))
7266         gp_free((GV*)sv);
7267     if (GvSTASH(sv)) {
7268         sv_del_backref((SV*)GvSTASH(sv), sv);
7269         GvSTASH(sv) = Nullhv;
7270     }
7271     sv_unmagic(sv, PERL_MAGIC_glob);
7272     Safefree(GvNAME(sv));
7273     GvMULTI_off(sv);
7274
7275     /* need to keep SvANY(sv) in the right arena */
7276     xpvmg = new_XPVMG();
7277     StructCopy(SvANY(sv), xpvmg, XPVMG);
7278     del_XPVGV(SvANY(sv));
7279     SvANY(sv) = xpvmg;
7280
7281     SvFLAGS(sv) &= ~SVTYPEMASK;
7282     SvFLAGS(sv) |= SVt_PVMG;
7283 }
7284
7285 /*
7286 =for apidoc sv_unref_flags
7287
7288 Unsets the RV status of the SV, and decrements the reference count of
7289 whatever was being referenced by the RV.  This can almost be thought of
7290 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7291 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7292 (otherwise the decrementing is conditional on the reference count being
7293 different from one or the reference being a readonly SV).
7294 See C<SvROK_off>.
7295
7296 =cut
7297 */
7298
7299 void
7300 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7301 {
7302     SV* const target = SvRV(ref);
7303
7304     if (SvWEAKREF(ref)) {
7305         sv_del_backref(target, ref);
7306         SvWEAKREF_off(ref);
7307         SvRV_set(ref, NULL);
7308         return;
7309     }
7310     SvRV_set(ref, NULL);
7311     SvROK_off(ref);
7312     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7313        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7314     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7315         SvREFCNT_dec(target);
7316     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7317         sv_2mortal(target);     /* Schedule for freeing later */
7318 }
7319
7320 /*
7321 =for apidoc sv_untaint
7322
7323 Untaint an SV. Use C<SvTAINTED_off> instead.
7324 =cut
7325 */
7326
7327 void
7328 Perl_sv_untaint(pTHX_ SV *sv)
7329 {
7330     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7331         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7332         if (mg)
7333             mg->mg_len &= ~1;
7334     }
7335 }
7336
7337 /*
7338 =for apidoc sv_tainted
7339
7340 Test an SV for taintedness. Use C<SvTAINTED> instead.
7341 =cut
7342 */
7343
7344 bool
7345 Perl_sv_tainted(pTHX_ SV *sv)
7346 {
7347     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7348         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7349         if (mg && (mg->mg_len & 1) )
7350             return TRUE;
7351     }
7352     return FALSE;
7353 }
7354
7355 /*
7356 =for apidoc sv_setpviv
7357
7358 Copies an integer into the given SV, also updating its string value.
7359 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7360
7361 =cut
7362 */
7363
7364 void
7365 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7366 {
7367     char buf[TYPE_CHARS(UV)];
7368     char *ebuf;
7369     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7370
7371     sv_setpvn(sv, ptr, ebuf - ptr);
7372 }
7373
7374 /*
7375 =for apidoc sv_setpviv_mg
7376
7377 Like C<sv_setpviv>, but also handles 'set' magic.
7378
7379 =cut
7380 */
7381
7382 void
7383 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7384 {
7385     sv_setpviv(sv, iv);
7386     SvSETMAGIC(sv);
7387 }
7388
7389 #if defined(PERL_IMPLICIT_CONTEXT)
7390
7391 /* pTHX_ magic can't cope with varargs, so this is a no-context
7392  * version of the main function, (which may itself be aliased to us).
7393  * Don't access this version directly.
7394  */
7395
7396 void
7397 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7398 {
7399     dTHX;
7400     va_list args;
7401     va_start(args, pat);
7402     sv_vsetpvf(sv, pat, &args);
7403     va_end(args);
7404 }
7405
7406 /* pTHX_ magic can't cope with varargs, so this is a no-context
7407  * version of the main function, (which may itself be aliased to us).
7408  * Don't access this version directly.
7409  */
7410
7411 void
7412 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7413 {
7414     dTHX;
7415     va_list args;
7416     va_start(args, pat);
7417     sv_vsetpvf_mg(sv, pat, &args);
7418     va_end(args);
7419 }
7420 #endif
7421
7422 /*
7423 =for apidoc sv_setpvf
7424
7425 Works like C<sv_catpvf> but copies the text into the SV instead of
7426 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7427
7428 =cut
7429 */
7430
7431 void
7432 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7433 {
7434     va_list args;
7435     va_start(args, pat);
7436     sv_vsetpvf(sv, pat, &args);
7437     va_end(args);
7438 }
7439
7440 /*
7441 =for apidoc sv_vsetpvf
7442
7443 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7444 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7445
7446 Usually used via its frontend C<sv_setpvf>.
7447
7448 =cut
7449 */
7450
7451 void
7452 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7453 {
7454     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7455 }
7456
7457 /*
7458 =for apidoc sv_setpvf_mg
7459
7460 Like C<sv_setpvf>, but also handles 'set' magic.
7461
7462 =cut
7463 */
7464
7465 void
7466 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7467 {
7468     va_list args;
7469     va_start(args, pat);
7470     sv_vsetpvf_mg(sv, pat, &args);
7471     va_end(args);
7472 }
7473
7474 /*
7475 =for apidoc sv_vsetpvf_mg
7476
7477 Like C<sv_vsetpvf>, but also handles 'set' magic.
7478
7479 Usually used via its frontend C<sv_setpvf_mg>.
7480
7481 =cut
7482 */
7483
7484 void
7485 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7486 {
7487     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7488     SvSETMAGIC(sv);
7489 }
7490
7491 #if defined(PERL_IMPLICIT_CONTEXT)
7492
7493 /* pTHX_ magic can't cope with varargs, so this is a no-context
7494  * version of the main function, (which may itself be aliased to us).
7495  * Don't access this version directly.
7496  */
7497
7498 void
7499 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7500 {
7501     dTHX;
7502     va_list args;
7503     va_start(args, pat);
7504     sv_vcatpvf(sv, pat, &args);
7505     va_end(args);
7506 }
7507
7508 /* pTHX_ magic can't cope with varargs, so this is a no-context
7509  * version of the main function, (which may itself be aliased to us).
7510  * Don't access this version directly.
7511  */
7512
7513 void
7514 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7515 {
7516     dTHX;
7517     va_list args;
7518     va_start(args, pat);
7519     sv_vcatpvf_mg(sv, pat, &args);
7520     va_end(args);
7521 }
7522 #endif
7523
7524 /*
7525 =for apidoc sv_catpvf
7526
7527 Processes its arguments like C<sprintf> and appends the formatted
7528 output to an SV.  If the appended data contains "wide" characters
7529 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7530 and characters >255 formatted with %c), the original SV might get
7531 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7532 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7533 valid UTF-8; if the original SV was bytes, the pattern should be too.
7534
7535 =cut */
7536
7537 void
7538 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7539 {
7540     va_list args;
7541     va_start(args, pat);
7542     sv_vcatpvf(sv, pat, &args);
7543     va_end(args);
7544 }
7545
7546 /*
7547 =for apidoc sv_vcatpvf
7548
7549 Processes its arguments like C<vsprintf> and appends the formatted output
7550 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7551
7552 Usually used via its frontend C<sv_catpvf>.
7553
7554 =cut
7555 */
7556
7557 void
7558 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7559 {
7560     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7561 }
7562
7563 /*
7564 =for apidoc sv_catpvf_mg
7565
7566 Like C<sv_catpvf>, but also handles 'set' magic.
7567
7568 =cut
7569 */
7570
7571 void
7572 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7573 {
7574     va_list args;
7575     va_start(args, pat);
7576     sv_vcatpvf_mg(sv, pat, &args);
7577     va_end(args);
7578 }
7579
7580 /*
7581 =for apidoc sv_vcatpvf_mg
7582
7583 Like C<sv_vcatpvf>, but also handles 'set' magic.
7584
7585 Usually used via its frontend C<sv_catpvf_mg>.
7586
7587 =cut
7588 */
7589
7590 void
7591 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7592 {
7593     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7594     SvSETMAGIC(sv);
7595 }
7596
7597 /*
7598 =for apidoc sv_vsetpvfn
7599
7600 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7601 appending it.
7602
7603 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7604
7605 =cut
7606 */
7607
7608 void
7609 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7610 {
7611     sv_setpvn(sv, "", 0);
7612     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7613 }
7614
7615 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7616
7617 STATIC I32
7618 S_expect_number(pTHX_ char** pattern)
7619 {
7620     I32 var = 0;
7621     switch (**pattern) {
7622     case '1': case '2': case '3':
7623     case '4': case '5': case '6':
7624     case '7': case '8': case '9':
7625         var = *(*pattern)++ - '0';
7626         while (isDIGIT(**pattern)) {
7627             I32 tmp = var * 10 + (*(*pattern)++ - '0');
7628             if (tmp < var)
7629                 Perl_croak(aTHX_ "Integer overflow in format string for %s", (PL_op ? OP_NAME(PL_op) : "sv_vcatpvfn"));
7630             var = tmp;
7631         }
7632     }
7633     return var;
7634 }
7635 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7636
7637 static char *
7638 F0convert(NV nv, char *endbuf, STRLEN *len)
7639 {
7640     const int neg = nv < 0;
7641     UV uv;
7642
7643     if (neg)
7644         nv = -nv;
7645     if (nv < UV_MAX) {
7646         char *p = endbuf;
7647         nv += 0.5;
7648         uv = (UV)nv;
7649         if (uv & 1 && uv == nv)
7650             uv--;                       /* Round to even */
7651         do {
7652             const unsigned dig = uv % 10;
7653             *--p = '0' + dig;
7654         } while (uv /= 10);
7655         if (neg)
7656             *--p = '-';
7657         *len = endbuf - p;
7658         return p;
7659     }
7660     return Nullch;
7661 }
7662
7663
7664 /*
7665 =for apidoc sv_vcatpvfn
7666
7667 Processes its arguments like C<vsprintf> and appends the formatted output
7668 to an SV.  Uses an array of SVs if the C style variable argument list is
7669 missing (NULL).  When running with taint checks enabled, indicates via
7670 C<maybe_tainted> if results are untrustworthy (often due to the use of
7671 locales).
7672
7673 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7674
7675 =cut
7676 */
7677
7678
7679 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7680                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7681                         vec_utf8 = DO_UTF8(vecsv);
7682
7683 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7684
7685 void
7686 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7687 {
7688     char *p;
7689     char *q;
7690     const char *patend;
7691     STRLEN origlen;
7692     I32 svix = 0;
7693     static const char nullstr[] = "(null)";
7694     SV *argsv = Nullsv;
7695     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7696     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7697     SV *nsv = Nullsv;
7698     /* Times 4: a decimal digit takes more than 3 binary digits.
7699      * NV_DIG: mantissa takes than many decimal digits.
7700      * Plus 32: Playing safe. */
7701     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7702     /* large enough for "%#.#f" --chip */
7703     /* what about long double NVs? --jhi */
7704
7705     PERL_UNUSED_ARG(maybe_tainted);
7706
7707     /* no matter what, this is a string now */
7708     (void)SvPV_force(sv, origlen);
7709
7710     /* special-case "", "%s", and "%-p" (SVf - see below) */
7711     if (patlen == 0)
7712         return;
7713     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7714         if (args) {
7715             const char * const s = va_arg(*args, char*);
7716             sv_catpv(sv, s ? s : nullstr);
7717         }
7718         else if (svix < svmax) {
7719             sv_catsv(sv, *svargs);
7720         }
7721         return;
7722     }
7723     if (args && patlen == 3 && pat[0] == '%' &&
7724                 pat[1] == '-' && pat[2] == 'p') {
7725         argsv = va_arg(*args, SV*);
7726         sv_catsv(sv, argsv);
7727         return;
7728     }
7729
7730 #ifndef USE_LONG_DOUBLE
7731     /* special-case "%.<number>[gf]" */
7732     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7733          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7734         unsigned digits = 0;
7735         const char *pp;
7736
7737         pp = pat + 2;
7738         while (*pp >= '0' && *pp <= '9')
7739             digits = 10 * digits + (*pp++ - '0');
7740         if (pp - pat == (int)patlen - 1) {
7741             NV nv;
7742
7743             if (svix < svmax)
7744                 nv = SvNV(*svargs);
7745             else
7746                 return;
7747             if (*pp == 'g') {
7748                 /* Add check for digits != 0 because it seems that some
7749                    gconverts are buggy in this case, and we don't yet have
7750                    a Configure test for this.  */
7751                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7752                      /* 0, point, slack */
7753                     Gconvert(nv, (int)digits, 0, ebuf);
7754                     sv_catpv(sv, ebuf);
7755                     if (*ebuf)  /* May return an empty string for digits==0 */
7756                         return;
7757                 }
7758             } else if (!digits) {
7759                 STRLEN l;
7760
7761                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7762                     sv_catpvn(sv, p, l);
7763                     return;
7764                 }
7765             }
7766         }
7767     }
7768 #endif /* !USE_LONG_DOUBLE */
7769
7770     if (!args && svix < svmax && DO_UTF8(*svargs))
7771         has_utf8 = TRUE;
7772
7773     patend = (char*)pat + patlen;
7774     for (p = (char*)pat; p < patend; p = q) {
7775         bool alt = FALSE;
7776         bool left = FALSE;
7777         bool vectorize = FALSE;
7778         bool vectorarg = FALSE;
7779         bool vec_utf8 = FALSE;
7780         char fill = ' ';
7781         char plus = 0;
7782         char intsize = 0;
7783         STRLEN width = 0;
7784         STRLEN zeros = 0;
7785         bool has_precis = FALSE;
7786         STRLEN precis = 0;
7787         I32 osvix = svix;
7788         bool is_utf8 = FALSE;  /* is this item utf8?   */
7789 #ifdef HAS_LDBL_SPRINTF_BUG
7790         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
7791            with sfio - Allen <allens@cpan.org> */
7792         bool fix_ldbl_sprintf_bug = FALSE;
7793 #endif
7794
7795         char esignbuf[4];
7796         U8 utf8buf[UTF8_MAXBYTES+1];
7797         STRLEN esignlen = 0;
7798
7799         const char *eptr = Nullch;
7800         STRLEN elen = 0;
7801         SV *vecsv = Nullsv;
7802         const U8 *vecstr = Null(U8*);
7803         STRLEN veclen = 0;
7804         char c = 0;
7805         int i;
7806         unsigned base = 0;
7807         IV iv = 0;
7808         UV uv = 0;
7809         /* we need a long double target in case HAS_LONG_DOUBLE but
7810            not USE_LONG_DOUBLE
7811         */
7812 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
7813         long double nv;
7814 #else
7815         NV nv;
7816 #endif
7817         STRLEN have;
7818         STRLEN need;
7819         STRLEN gap;
7820         const char *dotstr = ".";
7821         STRLEN dotstrlen = 1;
7822         I32 efix = 0; /* explicit format parameter index */
7823         I32 ewix = 0; /* explicit width index */
7824         I32 epix = 0; /* explicit precision index */
7825         I32 evix = 0; /* explicit vector index */
7826         bool asterisk = FALSE;
7827
7828         /* echo everything up to the next format specification */
7829         for (q = p; q < patend && *q != '%'; ++q) ;
7830         if (q > p) {
7831             if (has_utf8 && !pat_utf8)
7832                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
7833             else
7834                 sv_catpvn(sv, p, q - p);
7835             p = q;
7836         }
7837         if (q++ >= patend)
7838             break;
7839
7840 /*
7841     We allow format specification elements in this order:
7842         \d+\$              explicit format parameter index
7843         [-+ 0#]+           flags
7844         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
7845         0                  flag (as above): repeated to allow "v02"     
7846         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
7847         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
7848         [hlqLV]            size
7849     [%bcdefginopsuxDFOUX] format (mandatory)
7850 */
7851
7852         if (args) {
7853 /*  
7854         As of perl5.9.3, printf format checking is on by default.
7855         Internally, perl uses %p formats to provide an escape to
7856         some extended formatting.  This block deals with those
7857         extensions: if it does not match, (char*)q is reset and
7858         the normal format processing code is used.
7859
7860         Currently defined extensions are:
7861                 %p              include pointer address (standard)      
7862                 %-p     (SVf)   include an SV (previously %_)
7863                 %-<num>p        include an SV with precision <num>      
7864                 %1p     (VDf)   include a v-string (as %vd)
7865                 %<num>p         reserved for future extensions
7866
7867         Robin Barker 2005-07-14
7868 */
7869             char* r = q; 
7870             bool sv = FALSE;    
7871             STRLEN n = 0;
7872             if (*q == '-')
7873                 sv = *q++;
7874             EXPECT_NUMBER(q, n);
7875             if (*q++ == 'p') {
7876                 if (sv) {                       /* SVf */
7877                     if (n) {
7878                         precis = n;
7879                         has_precis = TRUE;
7880                     }
7881                     argsv = va_arg(*args, SV*);
7882                     eptr = SvPVx_const(argsv, elen);
7883                     if (DO_UTF8(argsv))
7884                         is_utf8 = TRUE;
7885                     goto string;
7886                 }
7887 #if vdNUMBER
7888                 else if (n == vdNUMBER) {       /* VDf */
7889                     vectorize = TRUE;
7890                     VECTORIZE_ARGS
7891                     goto format_vd;
7892                 }
7893 #endif
7894                 else if (n) {
7895                     if (ckWARN_d(WARN_INTERNAL))
7896                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
7897                         "internal %%<num>p might conflict with future printf extensions");
7898                 }
7899             }
7900             q = r; 
7901         }
7902
7903         if (EXPECT_NUMBER(q, width)) {
7904             if (*q == '$') {
7905                 ++q;
7906                 efix = width;
7907             } else {
7908                 goto gotwidth;
7909             }
7910         }
7911
7912         /* FLAGS */
7913
7914         while (*q) {
7915             switch (*q) {
7916             case ' ':
7917             case '+':
7918                 plus = *q++;
7919                 continue;
7920
7921             case '-':
7922                 left = TRUE;
7923                 q++;
7924                 continue;
7925
7926             case '0':
7927                 fill = *q++;
7928                 continue;
7929
7930             case '#':
7931                 alt = TRUE;
7932                 q++;
7933                 continue;
7934
7935             default:
7936                 break;
7937             }
7938             break;
7939         }
7940
7941       tryasterisk:
7942         if (*q == '*') {
7943             q++;
7944             if (EXPECT_NUMBER(q, ewix))
7945                 if (*q++ != '$')
7946                     goto unknown;
7947             asterisk = TRUE;
7948         }
7949         if (*q == 'v') {
7950             q++;
7951             if (vectorize)
7952                 goto unknown;
7953             if ((vectorarg = asterisk)) {
7954                 evix = ewix;
7955                 ewix = 0;
7956                 asterisk = FALSE;
7957             }
7958             vectorize = TRUE;
7959             goto tryasterisk;
7960         }
7961
7962         if (!asterisk)
7963         {
7964             if( *q == '0' )
7965                 fill = *q++;
7966             EXPECT_NUMBER(q, width);
7967         }
7968
7969         if (vectorize) {
7970             if (vectorarg) {
7971                 if (args)
7972                     vecsv = va_arg(*args, SV*);
7973                 else if (evix) {
7974                     vecsv = (evix > 0 && evix <= svmax)
7975                         ? svargs[evix-1] : &PL_sv_undef;
7976                 } else {
7977                     vecsv = svix < svmax ? svargs[svix++] : &PL_sv_undef;
7978                 }
7979                 dotstr = SvPV_const(vecsv, dotstrlen);
7980                 /* Keep the DO_UTF8 test *after* the SvPV call, else things go
7981                    bad with tied or overloaded values that return UTF8.  */
7982                 if (DO_UTF8(vecsv))
7983                     is_utf8 = TRUE;
7984                 else if (has_utf8) {
7985                     vecsv = sv_mortalcopy(vecsv);
7986                     sv_utf8_upgrade(vecsv);
7987                     dotstr = SvPV_const(vecsv, dotstrlen);
7988                     is_utf8 = TRUE;
7989                 }                   
7990             }
7991             if (args) {
7992                 VECTORIZE_ARGS
7993             }
7994             else if (efix ? (efix > 0 && efix <= svmax) : svix < svmax) {
7995                 vecsv = svargs[efix ? efix-1 : svix++];
7996                 vecstr = (U8*)SvPV_const(vecsv,veclen);
7997                 vec_utf8 = DO_UTF8(vecsv);
7998                 /* if this is a version object, we need to return the
7999                  * stringified representation (which the SvPVX_const has
8000                  * already done for us), but not vectorize the args
8001                  */
8002                 if ( *q == 'd' && sv_derived_from(vecsv,"version") )
8003                 {
8004                         q++; /* skip past the rest of the %vd format */
8005                         eptr = (const char *) vecstr;
8006                         elen = veclen;
8007                         if (elen && *eptr == 'v') {
8008                             eptr++;
8009                             elen--;
8010                         }
8011                         vectorize=FALSE;
8012                         goto string;
8013                 }
8014             }
8015             else {
8016                 vecstr = (U8*)"";
8017                 veclen = 0;
8018             }
8019         }
8020
8021         if (asterisk) {
8022             if (args)
8023                 i = va_arg(*args, int);
8024             else
8025                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8026                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8027             left |= (i < 0);
8028             width = (i < 0) ? -i : i;
8029         }
8030       gotwidth:
8031
8032         /* PRECISION */
8033
8034         if (*q == '.') {
8035             q++;
8036             if (*q == '*') {
8037                 q++;
8038                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8039                     goto unknown;
8040                 /* XXX: todo, support specified precision parameter */
8041                 if (epix)
8042                     goto unknown;
8043                 if (args)
8044                     i = va_arg(*args, int);
8045                 else
8046                     i = (ewix ? ewix <= svmax : svix < svmax)
8047                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8048                 precis = (i < 0) ? 0 : i;
8049             }
8050             else {
8051                 precis = 0;
8052                 while (isDIGIT(*q))
8053                     precis = precis * 10 + (*q++ - '0');
8054             }
8055             has_precis = TRUE;
8056         }
8057
8058         /* SIZE */
8059
8060         switch (*q) {
8061 #ifdef WIN32
8062         case 'I':                       /* Ix, I32x, and I64x */
8063 #  ifdef WIN64
8064             if (q[1] == '6' && q[2] == '4') {
8065                 q += 3;
8066                 intsize = 'q';
8067                 break;
8068             }
8069 #  endif
8070             if (q[1] == '3' && q[2] == '2') {
8071                 q += 3;
8072                 break;
8073             }
8074 #  ifdef WIN64
8075             intsize = 'q';
8076 #  endif
8077             q++;
8078             break;
8079 #endif
8080 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8081         case 'L':                       /* Ld */
8082             /* FALL THROUGH */
8083 #ifdef HAS_QUAD
8084         case 'q':                       /* qd */
8085 #endif
8086             intsize = 'q';
8087             q++;
8088             break;
8089 #endif
8090         case 'l':
8091 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8092             if (*(q + 1) == 'l') {      /* lld, llf */
8093                 intsize = 'q';
8094                 q += 2;
8095                 break;
8096              }
8097 #endif
8098             /* FALL THROUGH */
8099         case 'h':
8100             /* FALL THROUGH */
8101         case 'V':
8102             intsize = *q++;
8103             break;
8104         }
8105
8106         /* CONVERSION */
8107
8108         if (*q == '%') {
8109             eptr = q++;
8110             elen = 1;
8111             if (vectorize) {
8112                 c = '%';
8113                 goto unknown;
8114             }
8115             goto string;
8116         }
8117
8118         if (!vectorize && !args) {
8119             if (efix) {
8120                 const I32 i = efix-1;
8121                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8122             } else {
8123                 argsv = (svix >= 0 && svix < svmax)
8124                     ? svargs[svix++] : &PL_sv_undef;
8125             }
8126         }
8127
8128         switch (c = *q++) {
8129
8130             /* STRINGS */
8131
8132         case 'c':
8133             if (vectorize)
8134                 goto unknown;
8135             uv = (args) ? va_arg(*args, int) : SvIVx(argsv);
8136             if ((uv > 255 ||
8137                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8138                 && !IN_BYTES) {
8139                 eptr = (char*)utf8buf;
8140                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8141                 is_utf8 = TRUE;
8142             }
8143             else {
8144                 c = (char)uv;
8145                 eptr = &c;
8146                 elen = 1;
8147             }
8148             goto string;
8149
8150         case 's':
8151             if (vectorize)
8152                 goto unknown;
8153             if (args) {
8154                 eptr = va_arg(*args, char*);
8155                 if (eptr)
8156 #ifdef MACOS_TRADITIONAL
8157                   /* On MacOS, %#s format is used for Pascal strings */
8158                   if (alt)
8159                     elen = *eptr++;
8160                   else
8161 #endif
8162                     elen = strlen(eptr);
8163                 else {
8164                     eptr = (char *)nullstr;
8165                     elen = sizeof nullstr - 1;
8166                 }
8167             }
8168             else {
8169                 eptr = SvPVx_const(argsv, elen);
8170                 if (DO_UTF8(argsv)) {
8171                     if (has_precis && precis < elen) {
8172                         I32 p = precis;
8173                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8174                         precis = p;
8175                     }
8176                     if (width) { /* fudge width (can't fudge elen) */
8177                         width += elen - sv_len_utf8(argsv);
8178                     }
8179                     is_utf8 = TRUE;
8180                 }
8181             }
8182
8183         string:
8184             if (has_precis && elen > precis)
8185                 elen = precis;
8186             break;
8187
8188             /* INTEGERS */
8189
8190         case 'p':
8191             if (alt || vectorize)
8192                 goto unknown;
8193             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8194             base = 16;
8195             goto integer;
8196
8197         case 'D':
8198 #ifdef IV_IS_QUAD
8199             intsize = 'q';
8200 #else
8201             intsize = 'l';
8202 #endif
8203             /* FALL THROUGH */
8204         case 'd':
8205         case 'i':
8206 #if vdNUMBER
8207         format_vd:
8208 #endif
8209             if (vectorize) {
8210                 STRLEN ulen;
8211                 if (!veclen)
8212                     continue;
8213                 if (vec_utf8)
8214                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8215                                         UTF8_ALLOW_ANYUV);
8216                 else {
8217                     uv = *vecstr;
8218                     ulen = 1;
8219                 }
8220                 vecstr += ulen;
8221                 veclen -= ulen;
8222                 if (plus)
8223                      esignbuf[esignlen++] = plus;
8224             }
8225             else if (args) {
8226                 switch (intsize) {
8227                 case 'h':       iv = (short)va_arg(*args, int); break;
8228                 case 'l':       iv = va_arg(*args, long); break;
8229                 case 'V':       iv = va_arg(*args, IV); break;
8230                 default:        iv = va_arg(*args, int); break;
8231 #ifdef HAS_QUAD
8232                 case 'q':       iv = va_arg(*args, Quad_t); break;
8233 #endif
8234                 }
8235             }
8236             else {
8237                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8238                 switch (intsize) {
8239                 case 'h':       iv = (short)tiv; break;
8240                 case 'l':       iv = (long)tiv; break;
8241                 case 'V':
8242                 default:        iv = tiv; break;
8243 #ifdef HAS_QUAD
8244                 case 'q':       iv = (Quad_t)tiv; break;
8245 #endif
8246                 }
8247             }
8248             if ( !vectorize )   /* we already set uv above */
8249             {
8250                 if (iv >= 0) {
8251                     uv = iv;
8252                     if (plus)
8253                         esignbuf[esignlen++] = plus;
8254                 }
8255                 else {
8256                     uv = -iv;
8257                     esignbuf[esignlen++] = '-';
8258                 }
8259             }
8260             base = 10;
8261             goto integer;
8262
8263         case 'U':
8264 #ifdef IV_IS_QUAD
8265             intsize = 'q';
8266 #else
8267             intsize = 'l';
8268 #endif
8269             /* FALL THROUGH */
8270         case 'u':
8271             base = 10;
8272             goto uns_integer;
8273
8274         case 'b':
8275             base = 2;
8276             goto uns_integer;
8277
8278         case 'O':
8279 #ifdef IV_IS_QUAD
8280             intsize = 'q';
8281 #else
8282             intsize = 'l';
8283 #endif
8284             /* FALL THROUGH */
8285         case 'o':
8286             base = 8;
8287             goto uns_integer;
8288
8289         case 'X':
8290         case 'x':
8291             base = 16;
8292
8293         uns_integer:
8294             if (vectorize) {
8295                 STRLEN ulen;
8296         vector:
8297                 if (!veclen)
8298                     continue;
8299                 if (vec_utf8)
8300                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8301                                         UTF8_ALLOW_ANYUV);
8302                 else {
8303                     uv = *vecstr;
8304                     ulen = 1;
8305                 }
8306                 vecstr += ulen;
8307                 veclen -= ulen;
8308             }
8309             else if (args) {
8310                 switch (intsize) {
8311                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8312                 case 'l':  uv = va_arg(*args, unsigned long); break;
8313                 case 'V':  uv = va_arg(*args, UV); break;
8314                 default:   uv = va_arg(*args, unsigned); break;
8315 #ifdef HAS_QUAD
8316                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8317 #endif
8318                 }
8319             }
8320             else {
8321                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8322                 switch (intsize) {
8323                 case 'h':       uv = (unsigned short)tuv; break;
8324                 case 'l':       uv = (unsigned long)tuv; break;
8325                 case 'V':
8326                 default:        uv = tuv; break;
8327 #ifdef HAS_QUAD
8328                 case 'q':       uv = (Uquad_t)tuv; break;
8329 #endif
8330                 }
8331             }
8332
8333         integer:
8334             {
8335                 char *ptr = ebuf + sizeof ebuf;
8336                 switch (base) {
8337                     unsigned dig;
8338                 case 16:
8339                     if (!uv)
8340                         alt = FALSE;
8341                     p = (char*)((c == 'X')
8342                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8343                     do {
8344                         dig = uv & 15;
8345                         *--ptr = p[dig];
8346                     } while (uv >>= 4);
8347                     if (alt) {
8348                         esignbuf[esignlen++] = '0';
8349                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8350                     }
8351                     break;
8352                 case 8:
8353                     do {
8354                         dig = uv & 7;
8355                         *--ptr = '0' + dig;
8356                     } while (uv >>= 3);
8357                     if (alt && *ptr != '0')
8358                         *--ptr = '0';
8359                     break;
8360                 case 2:
8361                     if (!uv)
8362                         alt = FALSE;
8363                     do {
8364                         dig = uv & 1;
8365                         *--ptr = '0' + dig;
8366                     } while (uv >>= 1);
8367                     if (alt) {
8368                         esignbuf[esignlen++] = '0';
8369                         esignbuf[esignlen++] = 'b';
8370                     }
8371                     break;
8372                 default:                /* it had better be ten or less */
8373                     do {
8374                         dig = uv % base;
8375                         *--ptr = '0' + dig;
8376                     } while (uv /= base);
8377                     break;
8378                 }
8379                 elen = (ebuf + sizeof ebuf) - ptr;
8380                 eptr = ptr;
8381                 if (has_precis) {
8382                     if (precis > elen)
8383                         zeros = precis - elen;
8384                     else if (precis == 0 && elen == 1 && *eptr == '0')
8385                         elen = 0;
8386                 }
8387             }
8388             break;
8389
8390             /* FLOATING POINT */
8391
8392         case 'F':
8393             c = 'f';            /* maybe %F isn't supported here */
8394             /* FALL THROUGH */
8395         case 'e': case 'E':
8396         case 'f':
8397         case 'g': case 'G':
8398             if (vectorize)
8399                 goto unknown;
8400
8401             /* This is evil, but floating point is even more evil */
8402
8403             /* for SV-style calling, we can only get NV
8404                for C-style calling, we assume %f is double;
8405                for simplicity we allow any of %Lf, %llf, %qf for long double
8406             */
8407             switch (intsize) {
8408             case 'V':
8409 #if defined(USE_LONG_DOUBLE)
8410                 intsize = 'q';
8411 #endif
8412                 break;
8413 /* [perl #20339] - we should accept and ignore %lf rather than die */
8414             case 'l':
8415                 /* FALL THROUGH */
8416             default:
8417 #if defined(USE_LONG_DOUBLE)
8418                 intsize = args ? 0 : 'q';
8419 #endif
8420                 break;
8421             case 'q':
8422 #if defined(HAS_LONG_DOUBLE)
8423                 break;
8424 #else
8425                 /* FALL THROUGH */
8426 #endif
8427             case 'h':
8428                 goto unknown;
8429             }
8430
8431             /* now we need (long double) if intsize == 'q', else (double) */
8432             nv = (args) ?
8433 #if LONG_DOUBLESIZE > DOUBLESIZE
8434                 intsize == 'q' ?
8435                     va_arg(*args, long double) :
8436                     va_arg(*args, double)
8437 #else
8438                     va_arg(*args, double)
8439 #endif
8440                 : SvNVx(argsv);
8441
8442             need = 0;
8443             if (c != 'e' && c != 'E') {
8444                 i = PERL_INT_MIN;
8445                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8446                    will cast our (long double) to (double) */
8447                 (void)Perl_frexp(nv, &i);
8448                 if (i == PERL_INT_MIN)
8449                     Perl_die(aTHX_ "panic: frexp");
8450                 if (i > 0)
8451                     need = BIT_DIGITS(i);
8452             }
8453             need += has_precis ? precis : 6; /* known default */
8454
8455             if (need < width)
8456                 need = width;
8457
8458 #ifdef HAS_LDBL_SPRINTF_BUG
8459             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8460                with sfio - Allen <allens@cpan.org> */
8461
8462 #  ifdef DBL_MAX
8463 #    define MY_DBL_MAX DBL_MAX
8464 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8465 #    if DOUBLESIZE >= 8
8466 #      define MY_DBL_MAX 1.7976931348623157E+308L
8467 #    else
8468 #      define MY_DBL_MAX 3.40282347E+38L
8469 #    endif
8470 #  endif
8471
8472 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8473 #    define MY_DBL_MAX_BUG 1L
8474 #  else
8475 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8476 #  endif
8477
8478 #  ifdef DBL_MIN
8479 #    define MY_DBL_MIN DBL_MIN
8480 #  else  /* XXX guessing! -Allen */
8481 #    if DOUBLESIZE >= 8
8482 #      define MY_DBL_MIN 2.2250738585072014E-308L
8483 #    else
8484 #      define MY_DBL_MIN 1.17549435E-38L
8485 #    endif
8486 #  endif
8487
8488             if ((intsize == 'q') && (c == 'f') &&
8489                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8490                 (need < DBL_DIG)) {
8491                 /* it's going to be short enough that
8492                  * long double precision is not needed */
8493
8494                 if ((nv <= 0L) && (nv >= -0L))
8495                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8496                 else {
8497                     /* would use Perl_fp_class as a double-check but not
8498                      * functional on IRIX - see perl.h comments */
8499
8500                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8501                         /* It's within the range that a double can represent */
8502 #if defined(DBL_MAX) && !defined(DBL_MIN)
8503                         if ((nv >= ((long double)1/DBL_MAX)) ||
8504                             (nv <= (-(long double)1/DBL_MAX)))
8505 #endif
8506                         fix_ldbl_sprintf_bug = TRUE;
8507                     }
8508                 }
8509                 if (fix_ldbl_sprintf_bug == TRUE) {
8510                     double temp;
8511
8512                     intsize = 0;
8513                     temp = (double)nv;
8514                     nv = (NV)temp;
8515                 }
8516             }
8517
8518 #  undef MY_DBL_MAX
8519 #  undef MY_DBL_MAX_BUG
8520 #  undef MY_DBL_MIN
8521
8522 #endif /* HAS_LDBL_SPRINTF_BUG */
8523
8524             need += 20; /* fudge factor */
8525             if (PL_efloatsize < need) {
8526                 Safefree(PL_efloatbuf);
8527                 PL_efloatsize = need + 20; /* more fudge */
8528                 Newx(PL_efloatbuf, PL_efloatsize, char);
8529                 PL_efloatbuf[0] = '\0';
8530             }
8531
8532             if ( !(width || left || plus || alt) && fill != '0'
8533                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8534                 /* See earlier comment about buggy Gconvert when digits,
8535                    aka precis is 0  */
8536                 if ( c == 'g' && precis) {
8537                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8538                     /* May return an empty string for digits==0 */
8539                     if (*PL_efloatbuf) {
8540                         elen = strlen(PL_efloatbuf);
8541                         goto float_converted;
8542                     }
8543                 } else if ( c == 'f' && !precis) {
8544                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8545                         break;
8546                 }
8547             }
8548             {
8549                 char *ptr = ebuf + sizeof ebuf;
8550                 *--ptr = '\0';
8551                 *--ptr = c;
8552                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8553 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8554                 if (intsize == 'q') {
8555                     /* Copy the one or more characters in a long double
8556                      * format before the 'base' ([efgEFG]) character to
8557                      * the format string. */
8558                     static char const prifldbl[] = PERL_PRIfldbl;
8559                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8560                     while (p >= prifldbl) { *--ptr = *p--; }
8561                 }
8562 #endif
8563                 if (has_precis) {
8564                     base = precis;
8565                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8566                     *--ptr = '.';
8567                 }
8568                 if (width) {
8569                     base = width;
8570                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8571                 }
8572                 if (fill == '0')
8573                     *--ptr = fill;
8574                 if (left)
8575                     *--ptr = '-';
8576                 if (plus)
8577                     *--ptr = plus;
8578                 if (alt)
8579                     *--ptr = '#';
8580                 *--ptr = '%';
8581
8582                 /* No taint.  Otherwise we are in the strange situation
8583                  * where printf() taints but print($float) doesn't.
8584                  * --jhi */
8585 #if defined(HAS_LONG_DOUBLE)
8586                 elen = ((intsize == 'q')
8587                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8588                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8589 #else
8590                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8591 #endif
8592             }
8593         float_converted:
8594             eptr = PL_efloatbuf;
8595             break;
8596
8597             /* SPECIAL */
8598
8599         case 'n':
8600             if (vectorize)
8601                 goto unknown;
8602             i = SvCUR(sv) - origlen;
8603             if (args) {
8604                 switch (intsize) {
8605                 case 'h':       *(va_arg(*args, short*)) = i; break;
8606                 default:        *(va_arg(*args, int*)) = i; break;
8607                 case 'l':       *(va_arg(*args, long*)) = i; break;
8608                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8609 #ifdef HAS_QUAD
8610                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8611 #endif
8612                 }
8613             }
8614             else
8615                 sv_setuv_mg(argsv, (UV)i);
8616             continue;   /* not "break" */
8617
8618             /* UNKNOWN */
8619
8620         default:
8621       unknown:
8622             if (!args
8623                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8624                 && ckWARN(WARN_PRINTF))
8625             {
8626                 SV * const msg = sv_newmortal();
8627                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8628                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8629                 if (c) {
8630                     if (isPRINT(c))
8631                         Perl_sv_catpvf(aTHX_ msg,
8632                                        "\"%%%c\"", c & 0xFF);
8633                     else
8634                         Perl_sv_catpvf(aTHX_ msg,
8635                                        "\"%%\\%03"UVof"\"",
8636                                        (UV)c & 0xFF);
8637                 } else
8638                     sv_catpv(msg, "end of string");
8639                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8640             }
8641
8642             /* output mangled stuff ... */
8643             if (c == '\0')
8644                 --q;
8645             eptr = p;
8646             elen = q - p;
8647
8648             /* ... right here, because formatting flags should not apply */
8649             SvGROW(sv, SvCUR(sv) + elen + 1);
8650             p = SvEND(sv);
8651             Copy(eptr, p, elen, char);
8652             p += elen;
8653             *p = '\0';
8654             SvCUR_set(sv, p - SvPVX_const(sv));
8655             svix = osvix;
8656             continue;   /* not "break" */
8657         }
8658
8659         /* calculate width before utf8_upgrade changes it */
8660         have = esignlen + zeros + elen;
8661         if (have < zeros)
8662             Perl_croak_nocontext(PL_memory_wrap);
8663
8664         if (is_utf8 != has_utf8) {
8665              if (is_utf8) {
8666                   if (SvCUR(sv))
8667                        sv_utf8_upgrade(sv);
8668              }
8669              else {
8670                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8671                   sv_utf8_upgrade(nsv);
8672                   eptr = SvPVX_const(nsv);
8673                   elen = SvCUR(nsv);
8674              }
8675              SvGROW(sv, SvCUR(sv) + elen + 1);
8676              p = SvEND(sv);
8677              *p = '\0';
8678         }
8679
8680         need = (have > width ? have : width);
8681         gap = need - have;
8682
8683         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8684             Perl_croak_nocontext(PL_memory_wrap);
8685         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8686         p = SvEND(sv);
8687         if (esignlen && fill == '0') {
8688             int i;
8689             for (i = 0; i < (int)esignlen; i++)
8690                 *p++ = esignbuf[i];
8691         }
8692         if (gap && !left) {
8693             memset(p, fill, gap);
8694             p += gap;
8695         }
8696         if (esignlen && fill != '0') {
8697             int i;
8698             for (i = 0; i < (int)esignlen; i++)
8699                 *p++ = esignbuf[i];
8700         }
8701         if (zeros) {
8702             int i;
8703             for (i = zeros; i; i--)
8704                 *p++ = '0';
8705         }
8706         if (elen) {
8707             Copy(eptr, p, elen, char);
8708             p += elen;
8709         }
8710         if (gap && left) {
8711             memset(p, ' ', gap);
8712             p += gap;
8713         }
8714         if (vectorize) {
8715             if (veclen) {
8716                 Copy(dotstr, p, dotstrlen, char);
8717                 p += dotstrlen;
8718             }
8719             else
8720                 vectorize = FALSE;              /* done iterating over vecstr */
8721         }
8722         if (is_utf8)
8723             has_utf8 = TRUE;
8724         if (has_utf8)
8725             SvUTF8_on(sv);
8726         *p = '\0';
8727         SvCUR_set(sv, p - SvPVX_const(sv));
8728         if (vectorize) {
8729             esignlen = 0;
8730             goto vector;
8731         }
8732     }
8733 }
8734
8735 /* =========================================================================
8736
8737 =head1 Cloning an interpreter
8738
8739 All the macros and functions in this section are for the private use of
8740 the main function, perl_clone().
8741
8742 The foo_dup() functions make an exact copy of an existing foo thinngy.
8743 During the course of a cloning, a hash table is used to map old addresses
8744 to new addresses. The table is created and manipulated with the
8745 ptr_table_* functions.
8746
8747 =cut
8748
8749 ============================================================================*/
8750
8751
8752 #if defined(USE_ITHREADS)
8753
8754 #ifndef GpREFCNT_inc
8755 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8756 #endif
8757
8758
8759 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8760 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8761 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8762 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8763 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8764 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8765 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8766 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8767 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8768 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8769 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8770 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8771 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8772
8773
8774 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8775    regcomp.c. AMS 20010712 */
8776
8777 REGEXP *
8778 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8779 {
8780     dVAR;
8781     REGEXP *ret;
8782     int i, len, npar;
8783     struct reg_substr_datum *s;
8784
8785     if (!r)
8786         return (REGEXP *)NULL;
8787
8788     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8789         return ret;
8790
8791     len = r->offsets[0];
8792     npar = r->nparens+1;
8793
8794     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8795     Copy(r->program, ret->program, len+1, regnode);
8796
8797     Newx(ret->startp, npar, I32);
8798     Copy(r->startp, ret->startp, npar, I32);
8799     Newx(ret->endp, npar, I32);
8800     Copy(r->startp, ret->startp, npar, I32);
8801
8802     Newx(ret->substrs, 1, struct reg_substr_data);
8803     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
8804         s->min_offset = r->substrs->data[i].min_offset;
8805         s->max_offset = r->substrs->data[i].max_offset;
8806         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
8807         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
8808     }
8809
8810     ret->regstclass = NULL;
8811     if (r->data) {
8812         struct reg_data *d;
8813         const int count = r->data->count;
8814         int i;
8815
8816         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
8817                 char, struct reg_data);
8818         Newx(d->what, count, U8);
8819
8820         d->count = count;
8821         for (i = 0; i < count; i++) {
8822             d->what[i] = r->data->what[i];
8823             switch (d->what[i]) {
8824                 /* legal options are one of: sfpont
8825                    see also regcomp.h and pregfree() */
8826             case 's':
8827                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
8828                 break;
8829             case 'p':
8830                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
8831                 break;
8832             case 'f':
8833                 /* This is cheating. */
8834                 Newx(d->data[i], 1, struct regnode_charclass_class);
8835                 StructCopy(r->data->data[i], d->data[i],
8836                             struct regnode_charclass_class);
8837                 ret->regstclass = (regnode*)d->data[i];
8838                 break;
8839             case 'o':
8840                 /* Compiled op trees are readonly, and can thus be
8841                    shared without duplication. */
8842                 OP_REFCNT_LOCK;
8843                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
8844                 OP_REFCNT_UNLOCK;
8845                 break;
8846             case 'n':
8847                 d->data[i] = r->data->data[i];
8848                 break;
8849             case 't':
8850                 d->data[i] = r->data->data[i];
8851                 OP_REFCNT_LOCK;
8852                 ((reg_trie_data*)d->data[i])->refcount++;
8853                 OP_REFCNT_UNLOCK;
8854                 break;
8855             default:
8856                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
8857             }
8858         }
8859
8860         ret->data = d;
8861     }
8862     else
8863         ret->data = NULL;
8864
8865     Newx(ret->offsets, 2*len+1, U32);
8866     Copy(r->offsets, ret->offsets, 2*len+1, U32);
8867
8868     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
8869     ret->refcnt         = r->refcnt;
8870     ret->minlen         = r->minlen;
8871     ret->prelen         = r->prelen;
8872     ret->nparens        = r->nparens;
8873     ret->lastparen      = r->lastparen;
8874     ret->lastcloseparen = r->lastcloseparen;
8875     ret->reganch        = r->reganch;
8876
8877     ret->sublen         = r->sublen;
8878
8879     if (RX_MATCH_COPIED(ret))
8880         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
8881     else
8882         ret->subbeg = Nullch;
8883 #ifdef PERL_OLD_COPY_ON_WRITE
8884     ret->saved_copy = Nullsv;
8885 #endif
8886
8887     ptr_table_store(PL_ptr_table, r, ret);
8888     return ret;
8889 }
8890
8891 /* duplicate a file handle */
8892
8893 PerlIO *
8894 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
8895 {
8896     PerlIO *ret;
8897
8898     PERL_UNUSED_ARG(type);
8899
8900     if (!fp)
8901         return (PerlIO*)NULL;
8902
8903     /* look for it in the table first */
8904     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
8905     if (ret)
8906         return ret;
8907
8908     /* create anew and remember what it is */
8909     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
8910     ptr_table_store(PL_ptr_table, fp, ret);
8911     return ret;
8912 }
8913
8914 /* duplicate a directory handle */
8915
8916 DIR *
8917 Perl_dirp_dup(pTHX_ DIR *dp)
8918 {
8919     if (!dp)
8920         return (DIR*)NULL;
8921     /* XXX TODO */
8922     return dp;
8923 }
8924
8925 /* duplicate a typeglob */
8926
8927 GP *
8928 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
8929 {
8930     GP *ret;
8931     if (!gp)
8932         return (GP*)NULL;
8933     /* look for it in the table first */
8934     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
8935     if (ret)
8936         return ret;
8937
8938     /* create anew and remember what it is */
8939     Newxz(ret, 1, GP);
8940     ptr_table_store(PL_ptr_table, gp, ret);
8941
8942     /* clone */
8943     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
8944     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
8945     ret->gp_io          = io_dup_inc(gp->gp_io, param);
8946     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
8947     ret->gp_av          = av_dup_inc(gp->gp_av, param);
8948     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
8949     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
8950     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
8951     ret->gp_cvgen       = gp->gp_cvgen;
8952     ret->gp_line        = gp->gp_line;
8953     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
8954     return ret;
8955 }
8956
8957 /* duplicate a chain of magic */
8958
8959 MAGIC *
8960 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
8961 {
8962     MAGIC *mgprev = (MAGIC*)NULL;
8963     MAGIC *mgret;
8964     if (!mg)
8965         return (MAGIC*)NULL;
8966     /* look for it in the table first */
8967     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
8968     if (mgret)
8969         return mgret;
8970
8971     for (; mg; mg = mg->mg_moremagic) {
8972         MAGIC *nmg;
8973         Newxz(nmg, 1, MAGIC);
8974         if (mgprev)
8975             mgprev->mg_moremagic = nmg;
8976         else
8977             mgret = nmg;
8978         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
8979         nmg->mg_private = mg->mg_private;
8980         nmg->mg_type    = mg->mg_type;
8981         nmg->mg_flags   = mg->mg_flags;
8982         if (mg->mg_type == PERL_MAGIC_qr) {
8983             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
8984         }
8985         else if(mg->mg_type == PERL_MAGIC_backref) {
8986             const AV * const av = (AV*) mg->mg_obj;
8987             SV **svp;
8988             I32 i;
8989             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
8990             svp = AvARRAY(av);
8991             for (i = AvFILLp(av); i >= 0; i--) {
8992                 if (!svp[i]) continue;
8993                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
8994             }
8995         }
8996         else if (mg->mg_type == PERL_MAGIC_symtab) {
8997             nmg->mg_obj = mg->mg_obj;
8998         }
8999         else {
9000             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9001                               ? sv_dup_inc(mg->mg_obj, param)
9002                               : sv_dup(mg->mg_obj, param);
9003         }
9004         nmg->mg_len     = mg->mg_len;
9005         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9006         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9007             if (mg->mg_len > 0) {
9008                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9009                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9010                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9011                 {
9012                     AMT * const amtp = (AMT*)mg->mg_ptr;
9013                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9014                     I32 i;
9015                     for (i = 1; i < NofAMmeth; i++) {
9016                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9017                     }
9018                 }
9019             }
9020             else if (mg->mg_len == HEf_SVKEY)
9021                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9022         }
9023         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9024             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9025         }
9026         mgprev = nmg;
9027     }
9028     return mgret;
9029 }
9030
9031 /* create a new pointer-mapping table */
9032
9033 PTR_TBL_t *
9034 Perl_ptr_table_new(pTHX)
9035 {
9036     PTR_TBL_t *tbl;
9037     Newxz(tbl, 1, PTR_TBL_t);
9038     tbl->tbl_max        = 511;
9039     tbl->tbl_items      = 0;
9040     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9041     return tbl;
9042 }
9043
9044 #define PTR_TABLE_HASH(ptr) \
9045   ((PTR2UV(ptr) >> 3) ^ (PTR2UV(ptr) >> (3 + 7)) ^ (PTR2UV(ptr) >> (3 + 17)))
9046
9047 /* 
9048    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9049    following define) and at call to new_body_inline made below in 
9050    Perl_ptr_table_store()
9051  */
9052
9053 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9054
9055 /* map an existing pointer using a table */
9056
9057 STATIC PTR_TBL_ENT_t *
9058 S_ptr_table_find(pTHX_ PTR_TBL_t *tbl, const void *sv) {
9059     PTR_TBL_ENT_t *tblent;
9060     const UV hash = PTR_TABLE_HASH(sv);
9061     assert(tbl);
9062     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9063     for (; tblent; tblent = tblent->next) {
9064         if (tblent->oldval == sv)
9065             return tblent;
9066     }
9067     return 0;
9068 }
9069
9070 void *
9071 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9072 {
9073     PTR_TBL_ENT_t const *const tblent = S_ptr_table_find(aTHX_ tbl, sv);
9074     return tblent ? tblent->newval : (void *) 0;
9075 }
9076
9077 /* add a new entry to a pointer-mapping table */
9078
9079 void
9080 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9081 {
9082     PTR_TBL_ENT_t *tblent = S_ptr_table_find(aTHX_ tbl, oldsv);
9083
9084     if (tblent) {
9085         tblent->newval = newsv;
9086     } else {
9087         const UV entry = PTR_TABLE_HASH(oldsv) & tbl->tbl_max;
9088
9089         new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9090         tblent->oldval = oldsv;
9091         tblent->newval = newsv;
9092         tblent->next = tbl->tbl_ary[entry];
9093         tbl->tbl_ary[entry] = tblent;
9094         tbl->tbl_items++;
9095         if (tblent->next && tbl->tbl_items > tbl->tbl_max)
9096             ptr_table_split(tbl);
9097     }
9098 }
9099
9100 /* double the hash bucket size of an existing ptr table */
9101
9102 void
9103 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9104 {
9105     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9106     const UV oldsize = tbl->tbl_max + 1;
9107     UV newsize = oldsize * 2;
9108     UV i;
9109
9110     Renew(ary, newsize, PTR_TBL_ENT_t*);
9111     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9112     tbl->tbl_max = --newsize;
9113     tbl->tbl_ary = ary;
9114     for (i=0; i < oldsize; i++, ary++) {
9115         PTR_TBL_ENT_t **curentp, **entp, *ent;
9116         if (!*ary)
9117             continue;
9118         curentp = ary + oldsize;
9119         for (entp = ary, ent = *ary; ent; ent = *entp) {
9120             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9121                 *entp = ent->next;
9122                 ent->next = *curentp;
9123                 *curentp = ent;
9124                 continue;
9125             }
9126             else
9127                 entp = &ent->next;
9128         }
9129     }
9130 }
9131
9132 /* remove all the entries from a ptr table */
9133
9134 void
9135 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9136 {
9137     if (tbl && tbl->tbl_items) {
9138         register PTR_TBL_ENT_t **array = tbl->tbl_ary;
9139         UV riter = tbl->tbl_max;
9140
9141         do {
9142             PTR_TBL_ENT_t *entry = array[riter];
9143
9144             while (entry) {
9145                 PTR_TBL_ENT_t * const oentry = entry;
9146                 entry = entry->next;
9147                 del_pte(oentry);
9148             }
9149         } while (riter--);
9150
9151         tbl->tbl_items = 0;
9152     }
9153 }
9154
9155 /* clear and free a ptr table */
9156
9157 void
9158 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9159 {
9160     if (!tbl) {
9161         return;
9162     }
9163     ptr_table_clear(tbl);
9164     Safefree(tbl->tbl_ary);
9165     Safefree(tbl);
9166 }
9167
9168
9169 void
9170 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9171 {
9172     if (SvROK(sstr)) {
9173         SvRV_set(dstr, SvWEAKREF(sstr)
9174                        ? sv_dup(SvRV(sstr), param)
9175                        : sv_dup_inc(SvRV(sstr), param));
9176
9177     }
9178     else if (SvPVX_const(sstr)) {
9179         /* Has something there */
9180         if (SvLEN(sstr)) {
9181             /* Normal PV - clone whole allocated space */
9182             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9183             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9184                 /* Not that normal - actually sstr is copy on write.
9185                    But we are a true, independant SV, so:  */
9186                 SvREADONLY_off(dstr);
9187                 SvFAKE_off(dstr);
9188             }
9189         }
9190         else {
9191             /* Special case - not normally malloced for some reason */
9192             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9193                 /* A "shared" PV - clone it as "shared" PV */
9194                 SvPV_set(dstr,
9195                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9196                                          param)));
9197             }
9198             else {
9199                 /* Some other special case - random pointer */
9200                 SvPV_set(dstr, SvPVX(sstr));            
9201             }
9202         }
9203     }
9204     else {
9205         /* Copy the Null */
9206         if (SvTYPE(dstr) == SVt_RV)
9207             SvRV_set(dstr, NULL);
9208         else
9209             SvPV_set(dstr, 0);
9210     }
9211 }
9212
9213 /* duplicate an SV of any type (including AV, HV etc) */
9214
9215 SV *
9216 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9217 {
9218     dVAR;
9219     SV *dstr;
9220
9221     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9222         return Nullsv;
9223     /* look for it in the table first */
9224     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9225     if (dstr)
9226         return dstr;
9227
9228     if(param->flags & CLONEf_JOIN_IN) {
9229         /** We are joining here so we don't want do clone
9230             something that is bad **/
9231         const char *hvname;
9232
9233         if(SvTYPE(sstr) == SVt_PVHV &&
9234            (hvname = HvNAME_get(sstr))) {
9235             /** don't clone stashes if they already exist **/
9236             return (SV*)gv_stashpv(hvname,0);
9237         }
9238     }
9239
9240     /* create anew and remember what it is */
9241     new_SV(dstr);
9242
9243 #ifdef DEBUG_LEAKING_SCALARS
9244     dstr->sv_debug_optype = sstr->sv_debug_optype;
9245     dstr->sv_debug_line = sstr->sv_debug_line;
9246     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9247     dstr->sv_debug_cloned = 1;
9248 #  ifdef NETWARE
9249     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9250 #  else
9251     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9252 #  endif
9253 #endif
9254
9255     ptr_table_store(PL_ptr_table, sstr, dstr);
9256
9257     /* clone */
9258     SvFLAGS(dstr)       = SvFLAGS(sstr);
9259     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9260     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9261
9262 #ifdef DEBUGGING
9263     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9264         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9265                       PL_watch_pvx, SvPVX_const(sstr));
9266 #endif
9267
9268     /* don't clone objects whose class has asked us not to */
9269     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9270         SvFLAGS(dstr) &= ~SVTYPEMASK;
9271         SvOBJECT_off(dstr);
9272         return dstr;
9273     }
9274
9275     switch (SvTYPE(sstr)) {
9276     case SVt_NULL:
9277         SvANY(dstr)     = NULL;
9278         break;
9279     case SVt_IV:
9280         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9281         SvIV_set(dstr, SvIVX(sstr));
9282         break;
9283     case SVt_NV:
9284         SvANY(dstr)     = new_XNV();
9285         SvNV_set(dstr, SvNVX(sstr));
9286         break;
9287     case SVt_RV:
9288         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9289         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9290         break;
9291     default:
9292         {
9293             /* These are all the types that need complex bodies allocating.  */
9294             void *new_body;
9295             const svtype sv_type = SvTYPE(sstr);
9296             const struct body_details *const sv_type_details
9297                 = bodies_by_type + sv_type;
9298
9299             switch (sv_type) {
9300             default:
9301                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9302                            (IV)SvTYPE(sstr));
9303                 break;
9304
9305             case SVt_PVGV:
9306                 if (GvUNIQUE((GV*)sstr)) {
9307                     /* Do sharing here, and fall through */
9308                 }
9309             case SVt_PVIO:
9310             case SVt_PVFM:
9311             case SVt_PVHV:
9312             case SVt_PVAV:
9313             case SVt_PVBM:
9314             case SVt_PVCV:
9315             case SVt_PVLV:
9316             case SVt_PVMG:
9317             case SVt_PVNV:
9318             case SVt_PVIV:
9319             case SVt_PV:
9320                 assert(sv_type_details->copy);
9321                 if (sv_type_details->arena) {
9322                     new_body_inline(new_body, sv_type_details->copy, sv_type);
9323                     new_body
9324                         = (void*)((char*)new_body - sv_type_details->offset);
9325                 } else {
9326                     new_body = new_NOARENA(sv_type_details);
9327                 }
9328             }
9329             assert(new_body);
9330             SvANY(dstr) = new_body;
9331
9332 #ifndef PURIFY
9333             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9334                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9335                  sv_type_details->copy, char);
9336 #else
9337             Copy(((char*)SvANY(sstr)),
9338                  ((char*)SvANY(dstr)),
9339                  sv_type_details->size + sv_type_details->offset, char);
9340 #endif
9341
9342             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9343                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9344
9345             /* The Copy above means that all the source (unduplicated) pointers
9346                are now in the destination.  We can check the flags and the
9347                pointers in either, but it's possible that there's less cache
9348                missing by always going for the destination.
9349                FIXME - instrument and check that assumption  */
9350             if (sv_type >= SVt_PVMG) {
9351                 if (SvMAGIC(dstr))
9352                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9353                 if (SvSTASH(dstr))
9354                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9355             }
9356
9357             /* The cast silences a GCC warning about unhandled types.  */
9358             switch ((int)sv_type) {
9359             case SVt_PV:
9360                 break;
9361             case SVt_PVIV:
9362                 break;
9363             case SVt_PVNV:
9364                 break;
9365             case SVt_PVMG:
9366                 break;
9367             case SVt_PVBM:
9368                 break;
9369             case SVt_PVLV:
9370                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9371                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9372                     LvTARG(dstr) = dstr;
9373                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9374                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9375                 else
9376                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9377                 break;
9378             case SVt_PVGV:
9379                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9380                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9381                 /* Don't call sv_add_backref here as it's going to be created
9382                    as part of the magic cloning of the symbol table.  */
9383                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9384                 (void)GpREFCNT_inc(GvGP(dstr));
9385                 break;
9386             case SVt_PVIO:
9387                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9388                 if (IoOFP(dstr) == IoIFP(sstr))
9389                     IoOFP(dstr) = IoIFP(dstr);
9390                 else
9391                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9392                 /* PL_rsfp_filters entries have fake IoDIRP() */
9393                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9394                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9395                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9396                     /* I have no idea why fake dirp (rsfps)
9397                        should be treated differently but otherwise
9398                        we end up with leaks -- sky*/
9399                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9400                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9401                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9402                 } else {
9403                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9404                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9405                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9406                 }
9407                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9408                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9409                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9410                 break;
9411             case SVt_PVAV:
9412                 if (AvARRAY((AV*)sstr)) {
9413                     SV **dst_ary, **src_ary;
9414                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9415
9416                     src_ary = AvARRAY((AV*)sstr);
9417                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9418                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9419                     SvPV_set(dstr, (char*)dst_ary);
9420                     AvALLOC((AV*)dstr) = dst_ary;
9421                     if (AvREAL((AV*)sstr)) {
9422                         while (items-- > 0)
9423                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9424                     }
9425                     else {
9426                         while (items-- > 0)
9427                             *dst_ary++ = sv_dup(*src_ary++, param);
9428                     }
9429                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9430                     while (items-- > 0) {
9431                         *dst_ary++ = &PL_sv_undef;
9432                     }
9433                 }
9434                 else {
9435                     SvPV_set(dstr, Nullch);
9436                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9437                 }
9438                 break;
9439             case SVt_PVHV:
9440                 {
9441                     HEK *hvname = 0;
9442
9443                     if (HvARRAY((HV*)sstr)) {
9444                         STRLEN i = 0;
9445                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9446                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9447                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9448                         char *darray;
9449                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9450                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9451                             char);
9452                         HvARRAY(dstr) = (HE**)darray;
9453                         while (i <= sxhv->xhv_max) {
9454                             const HE *source = HvARRAY(sstr)[i];
9455                             HvARRAY(dstr)[i] = source
9456                                 ? he_dup(source, sharekeys, param) : 0;
9457                             ++i;
9458                         }
9459                         if (SvOOK(sstr)) {
9460                             struct xpvhv_aux * const saux = HvAUX(sstr);
9461                             struct xpvhv_aux * const daux = HvAUX(dstr);
9462                             /* This flag isn't copied.  */
9463                             /* SvOOK_on(hv) attacks the IV flags.  */
9464                             SvFLAGS(dstr) |= SVf_OOK;
9465
9466                             hvname = saux->xhv_name;
9467                             daux->xhv_name
9468                                 = hvname ? hek_dup(hvname, param) : hvname;
9469
9470                             daux->xhv_riter = saux->xhv_riter;
9471                             daux->xhv_eiter = saux->xhv_eiter
9472                                 ? he_dup(saux->xhv_eiter,
9473                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9474                         }
9475                     }
9476                     else {
9477                         SvPV_set(dstr, Nullch);
9478                     }
9479                     /* Record stashes for possible cloning in Perl_clone(). */
9480                     if(hvname)
9481                         av_push(param->stashes, dstr);
9482                 }
9483                 break;
9484             case SVt_PVFM:
9485             case SVt_PVCV:
9486                 /* NOTE: not refcounted */
9487                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9488                 OP_REFCNT_LOCK;
9489                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9490                 OP_REFCNT_UNLOCK;
9491                 if (CvCONST(dstr)) {
9492                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9493                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9494                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9495                 }
9496                 /* don't dup if copying back - CvGV isn't refcounted, so the
9497                  * duped GV may never be freed. A bit of a hack! DAPM */
9498                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9499                     Nullgv : gv_dup(CvGV(dstr), param) ;
9500                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9501                     CvDEPTH(dstr) = 0;
9502                 }
9503                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9504                 CvOUTSIDE(dstr) =
9505                     CvWEAKOUTSIDE(sstr)
9506                     ? cv_dup(    CvOUTSIDE(dstr), param)
9507                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9508                 if (!CvXSUB(dstr))
9509                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9510                 break;
9511             }
9512         }
9513     }
9514
9515     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9516         ++PL_sv_objcount;
9517
9518     return dstr;
9519  }
9520
9521 /* duplicate a context */
9522
9523 PERL_CONTEXT *
9524 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9525 {
9526     PERL_CONTEXT *ncxs;
9527
9528     if (!cxs)
9529         return (PERL_CONTEXT*)NULL;
9530
9531     /* look for it in the table first */
9532     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9533     if (ncxs)
9534         return ncxs;
9535
9536     /* create anew and remember what it is */
9537     Newxz(ncxs, max + 1, PERL_CONTEXT);
9538     ptr_table_store(PL_ptr_table, cxs, ncxs);
9539
9540     while (ix >= 0) {
9541         PERL_CONTEXT *cx = &cxs[ix];
9542         PERL_CONTEXT *ncx = &ncxs[ix];
9543         ncx->cx_type    = cx->cx_type;
9544         if (CxTYPE(cx) == CXt_SUBST) {
9545             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9546         }
9547         else {
9548             ncx->blk_oldsp      = cx->blk_oldsp;
9549             ncx->blk_oldcop     = cx->blk_oldcop;
9550             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9551             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9552             ncx->blk_oldpm      = cx->blk_oldpm;
9553             ncx->blk_gimme      = cx->blk_gimme;
9554             switch (CxTYPE(cx)) {
9555             case CXt_SUB:
9556                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9557                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9558                                            : cv_dup(cx->blk_sub.cv,param));
9559                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9560                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9561                                            : Nullav);
9562                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9563                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9564                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9565                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9566                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9567                 break;
9568             case CXt_EVAL:
9569                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9570                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9571                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9572                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9573                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9574                 ncx->blk_eval.retop = cx->blk_eval.retop;
9575                 break;
9576             case CXt_LOOP:
9577                 ncx->blk_loop.label     = cx->blk_loop.label;
9578                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9579                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9580                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9581                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9582                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9583                                            ? cx->blk_loop.iterdata
9584                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9585                 ncx->blk_loop.oldcomppad
9586                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9587                                             cx->blk_loop.oldcomppad);
9588                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9589                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9590                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9591                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9592                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9593                 break;
9594             case CXt_FORMAT:
9595                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9596                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9597                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9598                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9599                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9600                 break;
9601             case CXt_BLOCK:
9602             case CXt_NULL:
9603                 break;
9604             }
9605         }
9606         --ix;
9607     }
9608     return ncxs;
9609 }
9610
9611 /* duplicate a stack info structure */
9612
9613 PERL_SI *
9614 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9615 {
9616     PERL_SI *nsi;
9617
9618     if (!si)
9619         return (PERL_SI*)NULL;
9620
9621     /* look for it in the table first */
9622     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9623     if (nsi)
9624         return nsi;
9625
9626     /* create anew and remember what it is */
9627     Newxz(nsi, 1, PERL_SI);
9628     ptr_table_store(PL_ptr_table, si, nsi);
9629
9630     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9631     nsi->si_cxix        = si->si_cxix;
9632     nsi->si_cxmax       = si->si_cxmax;
9633     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9634     nsi->si_type        = si->si_type;
9635     nsi->si_prev        = si_dup(si->si_prev, param);
9636     nsi->si_next        = si_dup(si->si_next, param);
9637     nsi->si_markoff     = si->si_markoff;
9638
9639     return nsi;
9640 }
9641
9642 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9643 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9644 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9645 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9646 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9647 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9648 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9649 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9650 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9651 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9652 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9653 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9654 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9655 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9656
9657 /* XXXXX todo */
9658 #define pv_dup_inc(p)   SAVEPV(p)
9659 #define pv_dup(p)       SAVEPV(p)
9660 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9661
9662 /* map any object to the new equivent - either something in the
9663  * ptr table, or something in the interpreter structure
9664  */
9665
9666 void *
9667 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9668 {
9669     void *ret;
9670
9671     if (!v)
9672         return (void*)NULL;
9673
9674     /* look for it in the table first */
9675     ret = ptr_table_fetch(PL_ptr_table, v);
9676     if (ret)
9677         return ret;
9678
9679     /* see if it is part of the interpreter structure */
9680     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9681         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9682     else {
9683         ret = v;
9684     }
9685
9686     return ret;
9687 }
9688
9689 /* duplicate the save stack */
9690
9691 ANY *
9692 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9693 {
9694     ANY * const ss      = proto_perl->Tsavestack;
9695     const I32 max       = proto_perl->Tsavestack_max;
9696     I32 ix              = proto_perl->Tsavestack_ix;
9697     ANY *nss;
9698     SV *sv;
9699     GV *gv;
9700     AV *av;
9701     HV *hv;
9702     void* ptr;
9703     int intval;
9704     long longval;
9705     GP *gp;
9706     IV iv;
9707     char *c = NULL;
9708     void (*dptr) (void*);
9709     void (*dxptr) (pTHX_ void*);
9710
9711     Newxz(nss, max, ANY);
9712
9713     while (ix > 0) {
9714         I32 i = POPINT(ss,ix);
9715         TOPINT(nss,ix) = i;
9716         switch (i) {
9717         case SAVEt_ITEM:                        /* normal string */
9718             sv = (SV*)POPPTR(ss,ix);
9719             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9720             sv = (SV*)POPPTR(ss,ix);
9721             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9722             break;
9723         case SAVEt_SV:                          /* scalar reference */
9724             sv = (SV*)POPPTR(ss,ix);
9725             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9726             gv = (GV*)POPPTR(ss,ix);
9727             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9728             break;
9729         case SAVEt_GENERIC_PVREF:               /* generic char* */
9730             c = (char*)POPPTR(ss,ix);
9731             TOPPTR(nss,ix) = pv_dup(c);
9732             ptr = POPPTR(ss,ix);
9733             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9734             break;
9735         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9736             c = (char*)POPPTR(ss,ix);
9737             TOPPTR(nss,ix) = savesharedpv(c);
9738             ptr = POPPTR(ss,ix);
9739             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9740             break;
9741         case SAVEt_GENERIC_SVREF:               /* generic sv */
9742         case SAVEt_SVREF:                       /* scalar reference */
9743             sv = (SV*)POPPTR(ss,ix);
9744             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9745             ptr = POPPTR(ss,ix);
9746             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9747             break;
9748         case SAVEt_AV:                          /* array reference */
9749             av = (AV*)POPPTR(ss,ix);
9750             TOPPTR(nss,ix) = av_dup_inc(av, param);
9751             gv = (GV*)POPPTR(ss,ix);
9752             TOPPTR(nss,ix) = gv_dup(gv, param);
9753             break;
9754         case SAVEt_HV:                          /* hash reference */
9755             hv = (HV*)POPPTR(ss,ix);
9756             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9757             gv = (GV*)POPPTR(ss,ix);
9758             TOPPTR(nss,ix) = gv_dup(gv, param);
9759             break;
9760         case SAVEt_INT:                         /* int reference */
9761             ptr = POPPTR(ss,ix);
9762             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9763             intval = (int)POPINT(ss,ix);
9764             TOPINT(nss,ix) = intval;
9765             break;
9766         case SAVEt_LONG:                        /* long reference */
9767             ptr = POPPTR(ss,ix);
9768             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9769             longval = (long)POPLONG(ss,ix);
9770             TOPLONG(nss,ix) = longval;
9771             break;
9772         case SAVEt_I32:                         /* I32 reference */
9773         case SAVEt_I16:                         /* I16 reference */
9774         case SAVEt_I8:                          /* I8 reference */
9775             ptr = POPPTR(ss,ix);
9776             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9777             i = POPINT(ss,ix);
9778             TOPINT(nss,ix) = i;
9779             break;
9780         case SAVEt_IV:                          /* IV reference */
9781             ptr = POPPTR(ss,ix);
9782             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9783             iv = POPIV(ss,ix);
9784             TOPIV(nss,ix) = iv;
9785             break;
9786         case SAVEt_SPTR:                        /* SV* reference */
9787             ptr = POPPTR(ss,ix);
9788             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9789             sv = (SV*)POPPTR(ss,ix);
9790             TOPPTR(nss,ix) = sv_dup(sv, param);
9791             break;
9792         case SAVEt_VPTR:                        /* random* reference */
9793             ptr = POPPTR(ss,ix);
9794             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9795             ptr = POPPTR(ss,ix);
9796             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9797             break;
9798         case SAVEt_PPTR:                        /* char* reference */
9799             ptr = POPPTR(ss,ix);
9800             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9801             c = (char*)POPPTR(ss,ix);
9802             TOPPTR(nss,ix) = pv_dup(c);
9803             break;
9804         case SAVEt_HPTR:                        /* HV* reference */
9805             ptr = POPPTR(ss,ix);
9806             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9807             hv = (HV*)POPPTR(ss,ix);
9808             TOPPTR(nss,ix) = hv_dup(hv, param);
9809             break;
9810         case SAVEt_APTR:                        /* AV* reference */
9811             ptr = POPPTR(ss,ix);
9812             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9813             av = (AV*)POPPTR(ss,ix);
9814             TOPPTR(nss,ix) = av_dup(av, param);
9815             break;
9816         case SAVEt_NSTAB:
9817             gv = (GV*)POPPTR(ss,ix);
9818             TOPPTR(nss,ix) = gv_dup(gv, param);
9819             break;
9820         case SAVEt_GP:                          /* scalar reference */
9821             gp = (GP*)POPPTR(ss,ix);
9822             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
9823             (void)GpREFCNT_inc(gp);
9824             gv = (GV*)POPPTR(ss,ix);
9825             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9826             c = (char*)POPPTR(ss,ix);
9827             TOPPTR(nss,ix) = pv_dup(c);
9828             iv = POPIV(ss,ix);
9829             TOPIV(nss,ix) = iv;
9830             iv = POPIV(ss,ix);
9831             TOPIV(nss,ix) = iv;
9832             break;
9833         case SAVEt_FREESV:
9834         case SAVEt_MORTALIZESV:
9835             sv = (SV*)POPPTR(ss,ix);
9836             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9837             break;
9838         case SAVEt_FREEOP:
9839             ptr = POPPTR(ss,ix);
9840             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
9841                 /* these are assumed to be refcounted properly */
9842                 OP *o;
9843                 switch (((OP*)ptr)->op_type) {
9844                 case OP_LEAVESUB:
9845                 case OP_LEAVESUBLV:
9846                 case OP_LEAVEEVAL:
9847                 case OP_LEAVE:
9848                 case OP_SCOPE:
9849                 case OP_LEAVEWRITE:
9850                     TOPPTR(nss,ix) = ptr;
9851                     o = (OP*)ptr;
9852                     OpREFCNT_inc(o);
9853                     break;
9854                 default:
9855                     TOPPTR(nss,ix) = Nullop;
9856                     break;
9857                 }
9858             }
9859             else
9860                 TOPPTR(nss,ix) = Nullop;
9861             break;
9862         case SAVEt_FREEPV:
9863             c = (char*)POPPTR(ss,ix);
9864             TOPPTR(nss,ix) = pv_dup_inc(c);
9865             break;
9866         case SAVEt_CLEARSV:
9867             longval = POPLONG(ss,ix);
9868             TOPLONG(nss,ix) = longval;
9869             break;
9870         case SAVEt_DELETE:
9871             hv = (HV*)POPPTR(ss,ix);
9872             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9873             c = (char*)POPPTR(ss,ix);
9874             TOPPTR(nss,ix) = pv_dup_inc(c);
9875             i = POPINT(ss,ix);
9876             TOPINT(nss,ix) = i;
9877             break;
9878         case SAVEt_DESTRUCTOR:
9879             ptr = POPPTR(ss,ix);
9880             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9881             dptr = POPDPTR(ss,ix);
9882             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
9883                                         any_dup(FPTR2DPTR(void *, dptr),
9884                                                 proto_perl));
9885             break;
9886         case SAVEt_DESTRUCTOR_X:
9887             ptr = POPPTR(ss,ix);
9888             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9889             dxptr = POPDXPTR(ss,ix);
9890             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
9891                                          any_dup(FPTR2DPTR(void *, dxptr),
9892                                                  proto_perl));
9893             break;
9894         case SAVEt_REGCONTEXT:
9895         case SAVEt_ALLOC:
9896             i = POPINT(ss,ix);
9897             TOPINT(nss,ix) = i;
9898             ix -= i;
9899             break;
9900         case SAVEt_STACK_POS:           /* Position on Perl stack */
9901             i = POPINT(ss,ix);
9902             TOPINT(nss,ix) = i;
9903             break;
9904         case SAVEt_AELEM:               /* array element */
9905             sv = (SV*)POPPTR(ss,ix);
9906             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9907             i = POPINT(ss,ix);
9908             TOPINT(nss,ix) = i;
9909             av = (AV*)POPPTR(ss,ix);
9910             TOPPTR(nss,ix) = av_dup_inc(av, param);
9911             break;
9912         case SAVEt_HELEM:               /* hash element */
9913             sv = (SV*)POPPTR(ss,ix);
9914             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9915             sv = (SV*)POPPTR(ss,ix);
9916             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9917             hv = (HV*)POPPTR(ss,ix);
9918             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9919             break;
9920         case SAVEt_OP:
9921             ptr = POPPTR(ss,ix);
9922             TOPPTR(nss,ix) = ptr;
9923             break;
9924         case SAVEt_HINTS:
9925             i = POPINT(ss,ix);
9926             TOPINT(nss,ix) = i;
9927             break;
9928         case SAVEt_COMPPAD:
9929             av = (AV*)POPPTR(ss,ix);
9930             TOPPTR(nss,ix) = av_dup(av, param);
9931             break;
9932         case SAVEt_PADSV:
9933             longval = (long)POPLONG(ss,ix);
9934             TOPLONG(nss,ix) = longval;
9935             ptr = POPPTR(ss,ix);
9936             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9937             sv = (SV*)POPPTR(ss,ix);
9938             TOPPTR(nss,ix) = sv_dup(sv, param);
9939             break;
9940         case SAVEt_BOOL:
9941             ptr = POPPTR(ss,ix);
9942             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9943             longval = (long)POPBOOL(ss,ix);
9944             TOPBOOL(nss,ix) = (bool)longval;
9945             break;
9946         case SAVEt_SET_SVFLAGS:
9947             i = POPINT(ss,ix);
9948             TOPINT(nss,ix) = i;
9949             i = POPINT(ss,ix);
9950             TOPINT(nss,ix) = i;
9951             sv = (SV*)POPPTR(ss,ix);
9952             TOPPTR(nss,ix) = sv_dup(sv, param);
9953             break;
9954         default:
9955             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
9956         }
9957     }
9958
9959     return nss;
9960 }
9961
9962
9963 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
9964  * flag to the result. This is done for each stash before cloning starts,
9965  * so we know which stashes want their objects cloned */
9966
9967 static void
9968 do_mark_cloneable_stash(pTHX_ SV *sv)
9969 {
9970     const HEK * const hvname = HvNAME_HEK((HV*)sv);
9971     if (hvname) {
9972         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
9973         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
9974         if (cloner && GvCV(cloner)) {
9975             dSP;
9976             UV status;
9977
9978             ENTER;
9979             SAVETMPS;
9980             PUSHMARK(SP);
9981             XPUSHs(sv_2mortal(newSVhek(hvname)));
9982             PUTBACK;
9983             call_sv((SV*)GvCV(cloner), G_SCALAR);
9984             SPAGAIN;
9985             status = POPu;
9986             PUTBACK;
9987             FREETMPS;
9988             LEAVE;
9989             if (status)
9990                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
9991         }
9992     }
9993 }
9994
9995
9996
9997 /*
9998 =for apidoc perl_clone
9999
10000 Create and return a new interpreter by cloning the current one.
10001
10002 perl_clone takes these flags as parameters:
10003
10004 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10005 without it we only clone the data and zero the stacks,
10006 with it we copy the stacks and the new perl interpreter is
10007 ready to run at the exact same point as the previous one.
10008 The pseudo-fork code uses COPY_STACKS while the
10009 threads->new doesn't.
10010
10011 CLONEf_KEEP_PTR_TABLE
10012 perl_clone keeps a ptr_table with the pointer of the old
10013 variable as a key and the new variable as a value,
10014 this allows it to check if something has been cloned and not
10015 clone it again but rather just use the value and increase the
10016 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10017 the ptr_table using the function
10018 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10019 reason to keep it around is if you want to dup some of your own
10020 variable who are outside the graph perl scans, example of this
10021 code is in threads.xs create
10022
10023 CLONEf_CLONE_HOST
10024 This is a win32 thing, it is ignored on unix, it tells perls
10025 win32host code (which is c++) to clone itself, this is needed on
10026 win32 if you want to run two threads at the same time,
10027 if you just want to do some stuff in a separate perl interpreter
10028 and then throw it away and return to the original one,
10029 you don't need to do anything.
10030
10031 =cut
10032 */
10033
10034 /* XXX the above needs expanding by someone who actually understands it ! */
10035 EXTERN_C PerlInterpreter *
10036 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10037
10038 PerlInterpreter *
10039 perl_clone(PerlInterpreter *proto_perl, UV flags)
10040 {
10041    dVAR;
10042 #ifdef PERL_IMPLICIT_SYS
10043
10044    /* perlhost.h so we need to call into it
10045    to clone the host, CPerlHost should have a c interface, sky */
10046
10047    if (flags & CLONEf_CLONE_HOST) {
10048        return perl_clone_host(proto_perl,flags);
10049    }
10050    return perl_clone_using(proto_perl, flags,
10051                             proto_perl->IMem,
10052                             proto_perl->IMemShared,
10053                             proto_perl->IMemParse,
10054                             proto_perl->IEnv,
10055                             proto_perl->IStdIO,
10056                             proto_perl->ILIO,
10057                             proto_perl->IDir,
10058                             proto_perl->ISock,
10059                             proto_perl->IProc);
10060 }
10061
10062 PerlInterpreter *
10063 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10064                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10065                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10066                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10067                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10068                  struct IPerlProc* ipP)
10069 {
10070     /* XXX many of the string copies here can be optimized if they're
10071      * constants; they need to be allocated as common memory and just
10072      * their pointers copied. */
10073
10074     IV i;
10075     CLONE_PARAMS clone_params;
10076     CLONE_PARAMS* param = &clone_params;
10077
10078     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10079     /* for each stash, determine whether its objects should be cloned */
10080     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10081     PERL_SET_THX(my_perl);
10082
10083 #  ifdef DEBUGGING
10084     Poison(my_perl, 1, PerlInterpreter);
10085     PL_op = Nullop;
10086     PL_curcop = (COP *)Nullop;
10087     PL_markstack = 0;
10088     PL_scopestack = 0;
10089     PL_savestack = 0;
10090     PL_savestack_ix = 0;
10091     PL_savestack_max = -1;
10092     PL_sig_pending = 0;
10093     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10094 #  else /* !DEBUGGING */
10095     Zero(my_perl, 1, PerlInterpreter);
10096 #  endif        /* DEBUGGING */
10097
10098     /* host pointers */
10099     PL_Mem              = ipM;
10100     PL_MemShared        = ipMS;
10101     PL_MemParse         = ipMP;
10102     PL_Env              = ipE;
10103     PL_StdIO            = ipStd;
10104     PL_LIO              = ipLIO;
10105     PL_Dir              = ipD;
10106     PL_Sock             = ipS;
10107     PL_Proc             = ipP;
10108 #else           /* !PERL_IMPLICIT_SYS */
10109     IV i;
10110     CLONE_PARAMS clone_params;
10111     CLONE_PARAMS* param = &clone_params;
10112     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10113     /* for each stash, determine whether its objects should be cloned */
10114     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10115     PERL_SET_THX(my_perl);
10116
10117 #    ifdef DEBUGGING
10118     Poison(my_perl, 1, PerlInterpreter);
10119     PL_op = Nullop;
10120     PL_curcop = (COP *)Nullop;
10121     PL_markstack = 0;
10122     PL_scopestack = 0;
10123     PL_savestack = 0;
10124     PL_savestack_ix = 0;
10125     PL_savestack_max = -1;
10126     PL_sig_pending = 0;
10127     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10128 #    else       /* !DEBUGGING */
10129     Zero(my_perl, 1, PerlInterpreter);
10130 #    endif      /* DEBUGGING */
10131 #endif          /* PERL_IMPLICIT_SYS */
10132     param->flags = flags;
10133     param->proto_perl = proto_perl;
10134
10135     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10136     Zero(&PL_body_roots, 1, PL_body_roots);
10137     
10138     PL_nice_chunk       = NULL;
10139     PL_nice_chunk_size  = 0;
10140     PL_sv_count         = 0;
10141     PL_sv_objcount      = 0;
10142     PL_sv_root          = Nullsv;
10143     PL_sv_arenaroot     = Nullsv;
10144
10145     PL_debug            = proto_perl->Idebug;
10146
10147     PL_hash_seed        = proto_perl->Ihash_seed;
10148     PL_rehash_seed      = proto_perl->Irehash_seed;
10149
10150 #ifdef USE_REENTRANT_API
10151     /* XXX: things like -Dm will segfault here in perlio, but doing
10152      *  PERL_SET_CONTEXT(proto_perl);
10153      * breaks too many other things
10154      */
10155     Perl_reentrant_init(aTHX);
10156 #endif
10157
10158     /* create SV map for pointer relocation */
10159     PL_ptr_table = ptr_table_new();
10160
10161     /* initialize these special pointers as early as possible */
10162     SvANY(&PL_sv_undef)         = NULL;
10163     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10164     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10165     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10166
10167     SvANY(&PL_sv_no)            = new_XPVNV();
10168     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10169     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10170                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10171     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10172     SvCUR_set(&PL_sv_no, 0);
10173     SvLEN_set(&PL_sv_no, 1);
10174     SvIV_set(&PL_sv_no, 0);
10175     SvNV_set(&PL_sv_no, 0);
10176     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10177
10178     SvANY(&PL_sv_yes)           = new_XPVNV();
10179     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10180     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10181                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10182     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10183     SvCUR_set(&PL_sv_yes, 1);
10184     SvLEN_set(&PL_sv_yes, 2);
10185     SvIV_set(&PL_sv_yes, 1);
10186     SvNV_set(&PL_sv_yes, 1);
10187     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10188
10189     /* create (a non-shared!) shared string table */
10190     PL_strtab           = newHV();
10191     HvSHAREKEYS_off(PL_strtab);
10192     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10193     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10194
10195     PL_compiling = proto_perl->Icompiling;
10196
10197     /* These two PVs will be free'd special way so must set them same way op.c does */
10198     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10199     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10200
10201     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10202     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10203
10204     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10205     if (!specialWARN(PL_compiling.cop_warnings))
10206         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10207     if (!specialCopIO(PL_compiling.cop_io))
10208         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10209     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10210
10211     /* pseudo environmental stuff */
10212     PL_origargc         = proto_perl->Iorigargc;
10213     PL_origargv         = proto_perl->Iorigargv;
10214
10215     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10216
10217     /* Set tainting stuff before PerlIO_debug can possibly get called */
10218     PL_tainting         = proto_perl->Itainting;
10219     PL_taint_warn       = proto_perl->Itaint_warn;
10220
10221 #ifdef PERLIO_LAYERS
10222     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10223     PerlIO_clone(aTHX_ proto_perl, param);
10224 #endif
10225
10226     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10227     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10228     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10229     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10230     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10231     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10232
10233     /* switches */
10234     PL_minus_c          = proto_perl->Iminus_c;
10235     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10236     PL_localpatches     = proto_perl->Ilocalpatches;
10237     PL_splitstr         = proto_perl->Isplitstr;
10238     PL_preprocess       = proto_perl->Ipreprocess;
10239     PL_minus_n          = proto_perl->Iminus_n;
10240     PL_minus_p          = proto_perl->Iminus_p;
10241     PL_minus_l          = proto_perl->Iminus_l;
10242     PL_minus_a          = proto_perl->Iminus_a;
10243     PL_minus_F          = proto_perl->Iminus_F;
10244     PL_doswitches       = proto_perl->Idoswitches;
10245     PL_dowarn           = proto_perl->Idowarn;
10246     PL_doextract        = proto_perl->Idoextract;
10247     PL_sawampersand     = proto_perl->Isawampersand;
10248     PL_unsafe           = proto_perl->Iunsafe;
10249     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10250     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10251     PL_perldb           = proto_perl->Iperldb;
10252     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10253     PL_exit_flags       = proto_perl->Iexit_flags;
10254
10255     /* magical thingies */
10256     /* XXX time(&PL_basetime) when asked for? */
10257     PL_basetime         = proto_perl->Ibasetime;
10258     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10259
10260     PL_maxsysfd         = proto_perl->Imaxsysfd;
10261     PL_multiline        = proto_perl->Imultiline;
10262     PL_statusvalue      = proto_perl->Istatusvalue;
10263 #ifdef VMS
10264     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10265 #else
10266     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10267 #endif
10268     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10269
10270     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10271     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10272     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10273
10274     /* Clone the regex array */
10275     PL_regex_padav = newAV();
10276     {
10277         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10278         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10279         IV i;
10280         av_push(PL_regex_padav,
10281                 sv_dup_inc(regexen[0],param));
10282         for(i = 1; i <= len; i++) {
10283             if(SvREPADTMP(regexen[i])) {
10284               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10285             } else {
10286                 av_push(PL_regex_padav,
10287                     SvREFCNT_inc(
10288                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10289                              SvIVX(regexen[i])), param)))
10290                        ));
10291             }
10292         }
10293     }
10294     PL_regex_pad = AvARRAY(PL_regex_padav);
10295
10296     /* shortcuts to various I/O objects */
10297     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10298     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10299     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10300     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10301     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10302     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10303
10304     /* shortcuts to regexp stuff */
10305     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10306
10307     /* shortcuts to misc objects */
10308     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10309
10310     /* shortcuts to debugging objects */
10311     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10312     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10313     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10314     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10315     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10316     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10317     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10318     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10319     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10320
10321     /* symbol tables */
10322     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10323     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10324     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10325     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10326     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10327
10328     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10329     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10330     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10331     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10332     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10333     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10334
10335     PL_sub_generation   = proto_perl->Isub_generation;
10336
10337     /* funky return mechanisms */
10338     PL_forkprocess      = proto_perl->Iforkprocess;
10339
10340     /* subprocess state */
10341     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10342
10343     /* internal state */
10344     PL_maxo             = proto_perl->Imaxo;
10345     if (proto_perl->Iop_mask)
10346         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10347     else
10348         PL_op_mask      = Nullch;
10349     /* PL_asserting        = proto_perl->Iasserting; */
10350
10351     /* current interpreter roots */
10352     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10353     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10354     PL_main_start       = proto_perl->Imain_start;
10355     PL_eval_root        = proto_perl->Ieval_root;
10356     PL_eval_start       = proto_perl->Ieval_start;
10357
10358     /* runtime control stuff */
10359     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10360     PL_copline          = proto_perl->Icopline;
10361
10362     PL_filemode         = proto_perl->Ifilemode;
10363     PL_lastfd           = proto_perl->Ilastfd;
10364     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10365     PL_Argv             = NULL;
10366     PL_Cmd              = Nullch;
10367     PL_gensym           = proto_perl->Igensym;
10368     PL_preambled        = proto_perl->Ipreambled;
10369     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10370     PL_laststatval      = proto_perl->Ilaststatval;
10371     PL_laststype        = proto_perl->Ilaststype;
10372     PL_mess_sv          = Nullsv;
10373
10374     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10375
10376     /* interpreter atexit processing */
10377     PL_exitlistlen      = proto_perl->Iexitlistlen;
10378     if (PL_exitlistlen) {
10379         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10380         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10381     }
10382     else
10383         PL_exitlist     = (PerlExitListEntry*)NULL;
10384     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10385     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10386     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10387
10388     PL_profiledata      = NULL;
10389     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10390     /* PL_rsfp_filters entries have fake IoDIRP() */
10391     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10392
10393     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10394
10395     PAD_CLONE_VARS(proto_perl, param);
10396
10397 #ifdef HAVE_INTERP_INTERN
10398     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10399 #endif
10400
10401     /* more statics moved here */
10402     PL_generation       = proto_perl->Igeneration;
10403     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10404
10405     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10406     PL_in_clean_all     = proto_perl->Iin_clean_all;
10407
10408     PL_uid              = proto_perl->Iuid;
10409     PL_euid             = proto_perl->Ieuid;
10410     PL_gid              = proto_perl->Igid;
10411     PL_egid             = proto_perl->Iegid;
10412     PL_nomemok          = proto_perl->Inomemok;
10413     PL_an               = proto_perl->Ian;
10414     PL_evalseq          = proto_perl->Ievalseq;
10415     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10416     PL_origalen         = proto_perl->Iorigalen;
10417 #ifdef PERL_USES_PL_PIDSTATUS
10418     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10419 #endif
10420     PL_osname           = SAVEPV(proto_perl->Iosname);
10421     PL_sighandlerp      = proto_perl->Isighandlerp;
10422
10423     PL_runops           = proto_perl->Irunops;
10424
10425     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10426
10427 #ifdef CSH
10428     PL_cshlen           = proto_perl->Icshlen;
10429     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10430 #endif
10431
10432     PL_lex_state        = proto_perl->Ilex_state;
10433     PL_lex_defer        = proto_perl->Ilex_defer;
10434     PL_lex_expect       = proto_perl->Ilex_expect;
10435     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10436     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10437     PL_lex_starts       = proto_perl->Ilex_starts;
10438     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10439     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10440     PL_lex_op           = proto_perl->Ilex_op;
10441     PL_lex_inpat        = proto_perl->Ilex_inpat;
10442     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10443     PL_lex_brackets     = proto_perl->Ilex_brackets;
10444     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10445     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10446     PL_lex_casemods     = proto_perl->Ilex_casemods;
10447     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10448     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10449
10450     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10451     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10452     PL_nexttoke         = proto_perl->Inexttoke;
10453
10454     /* XXX This is probably masking the deeper issue of why
10455      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10456      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10457      * (A little debugging with a watchpoint on it may help.)
10458      */
10459     if (SvANY(proto_perl->Ilinestr)) {
10460         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10461         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10462         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10463         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10464         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10465         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10466         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10467         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10468         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10469     }
10470     else {
10471         PL_linestr = NEWSV(65,79);
10472         sv_upgrade(PL_linestr,SVt_PVIV);
10473         sv_setpvn(PL_linestr,"",0);
10474         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10475     }
10476     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10477     PL_pending_ident    = proto_perl->Ipending_ident;
10478     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10479
10480     PL_expect           = proto_perl->Iexpect;
10481
10482     PL_multi_start      = proto_perl->Imulti_start;
10483     PL_multi_end        = proto_perl->Imulti_end;
10484     PL_multi_open       = proto_perl->Imulti_open;
10485     PL_multi_close      = proto_perl->Imulti_close;
10486
10487     PL_error_count      = proto_perl->Ierror_count;
10488     PL_subline          = proto_perl->Isubline;
10489     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10490
10491     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10492     if (SvANY(proto_perl->Ilinestr)) {
10493         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10494         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10495         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10496         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10497         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10498     }
10499     else {
10500         PL_last_uni     = SvPVX(PL_linestr);
10501         PL_last_lop     = SvPVX(PL_linestr);
10502         PL_last_lop_op  = 0;
10503     }
10504     PL_in_my            = proto_perl->Iin_my;
10505     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10506 #ifdef FCRYPT
10507     PL_cryptseen        = proto_perl->Icryptseen;
10508 #endif
10509
10510     PL_hints            = proto_perl->Ihints;
10511
10512     PL_amagic_generation        = proto_perl->Iamagic_generation;
10513
10514 #ifdef USE_LOCALE_COLLATE
10515     PL_collation_ix     = proto_perl->Icollation_ix;
10516     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10517     PL_collation_standard       = proto_perl->Icollation_standard;
10518     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10519     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10520 #endif /* USE_LOCALE_COLLATE */
10521
10522 #ifdef USE_LOCALE_NUMERIC
10523     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10524     PL_numeric_standard = proto_perl->Inumeric_standard;
10525     PL_numeric_local    = proto_perl->Inumeric_local;
10526     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10527 #endif /* !USE_LOCALE_NUMERIC */
10528
10529     /* utf8 character classes */
10530     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10531     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10532     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10533     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10534     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10535     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10536     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10537     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10538     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10539     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10540     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10541     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10542     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10543     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10544     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10545     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10546     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10547     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10548     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10549     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10550
10551     /* Did the locale setup indicate UTF-8? */
10552     PL_utf8locale       = proto_perl->Iutf8locale;
10553     /* Unicode features (see perlrun/-C) */
10554     PL_unicode          = proto_perl->Iunicode;
10555
10556     /* Pre-5.8 signals control */
10557     PL_signals          = proto_perl->Isignals;
10558
10559     /* times() ticks per second */
10560     PL_clocktick        = proto_perl->Iclocktick;
10561
10562     /* Recursion stopper for PerlIO_find_layer */
10563     PL_in_load_module   = proto_perl->Iin_load_module;
10564
10565     /* sort() routine */
10566     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10567
10568     /* Not really needed/useful since the reenrant_retint is "volatile",
10569      * but do it for consistency's sake. */
10570     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10571
10572     /* Hooks to shared SVs and locks. */
10573     PL_sharehook        = proto_perl->Isharehook;
10574     PL_lockhook         = proto_perl->Ilockhook;
10575     PL_unlockhook       = proto_perl->Iunlockhook;
10576     PL_threadhook       = proto_perl->Ithreadhook;
10577
10578     PL_runops_std       = proto_perl->Irunops_std;
10579     PL_runops_dbg       = proto_perl->Irunops_dbg;
10580
10581 #ifdef THREADS_HAVE_PIDS
10582     PL_ppid             = proto_perl->Ippid;
10583 #endif
10584
10585     /* swatch cache */
10586     PL_last_swash_hv    = Nullhv;       /* reinits on demand */
10587     PL_last_swash_klen  = 0;
10588     PL_last_swash_key[0]= '\0';
10589     PL_last_swash_tmps  = (U8*)NULL;
10590     PL_last_swash_slen  = 0;
10591
10592     PL_glob_index       = proto_perl->Iglob_index;
10593     PL_srand_called     = proto_perl->Isrand_called;
10594     PL_uudmap['M']      = 0;            /* reinits on demand */
10595     PL_bitcount         = Nullch;       /* reinits on demand */
10596
10597     if (proto_perl->Ipsig_pend) {
10598         Newxz(PL_psig_pend, SIG_SIZE, int);
10599     }
10600     else {
10601         PL_psig_pend    = (int*)NULL;
10602     }
10603
10604     if (proto_perl->Ipsig_ptr) {
10605         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10606         Newxz(PL_psig_name, SIG_SIZE, SV*);
10607         for (i = 1; i < SIG_SIZE; i++) {
10608             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10609             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10610         }
10611     }
10612     else {
10613         PL_psig_ptr     = (SV**)NULL;
10614         PL_psig_name    = (SV**)NULL;
10615     }
10616
10617     /* thrdvar.h stuff */
10618
10619     if (flags & CLONEf_COPY_STACKS) {
10620         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10621         PL_tmps_ix              = proto_perl->Ttmps_ix;
10622         PL_tmps_max             = proto_perl->Ttmps_max;
10623         PL_tmps_floor           = proto_perl->Ttmps_floor;
10624         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10625         i = 0;
10626         while (i <= PL_tmps_ix) {
10627             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10628             ++i;
10629         }
10630
10631         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10632         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10633         Newxz(PL_markstack, i, I32);
10634         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10635                                                   - proto_perl->Tmarkstack);
10636         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10637                                                   - proto_perl->Tmarkstack);
10638         Copy(proto_perl->Tmarkstack, PL_markstack,
10639              PL_markstack_ptr - PL_markstack + 1, I32);
10640
10641         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10642          * NOTE: unlike the others! */
10643         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10644         PL_scopestack_max       = proto_perl->Tscopestack_max;
10645         Newxz(PL_scopestack, PL_scopestack_max, I32);
10646         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10647
10648         /* NOTE: si_dup() looks at PL_markstack */
10649         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10650
10651         /* PL_curstack          = PL_curstackinfo->si_stack; */
10652         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10653         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10654
10655         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10656         PL_stack_base           = AvARRAY(PL_curstack);
10657         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10658                                                    - proto_perl->Tstack_base);
10659         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10660
10661         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10662          * NOTE: unlike the others! */
10663         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10664         PL_savestack_max        = proto_perl->Tsavestack_max;
10665         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10666         PL_savestack            = ss_dup(proto_perl, param);
10667     }
10668     else {
10669         init_stacks();
10670         ENTER;                  /* perl_destruct() wants to LEAVE; */
10671     }
10672
10673     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10674     PL_top_env          = &PL_start_env;
10675
10676     PL_op               = proto_perl->Top;
10677
10678     PL_Sv               = Nullsv;
10679     PL_Xpv              = (XPV*)NULL;
10680     PL_na               = proto_perl->Tna;
10681
10682     PL_statbuf          = proto_perl->Tstatbuf;
10683     PL_statcache        = proto_perl->Tstatcache;
10684     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10685     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10686 #ifdef HAS_TIMES
10687     PL_timesbuf         = proto_perl->Ttimesbuf;
10688 #endif
10689
10690     PL_tainted          = proto_perl->Ttainted;
10691     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10692     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10693     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10694     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10695     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10696     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10697     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10698     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10699     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10700
10701     PL_restartop        = proto_perl->Trestartop;
10702     PL_in_eval          = proto_perl->Tin_eval;
10703     PL_delaymagic       = proto_perl->Tdelaymagic;
10704     PL_dirty            = proto_perl->Tdirty;
10705     PL_localizing       = proto_perl->Tlocalizing;
10706
10707     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10708     PL_hv_fetch_ent_mh  = Nullhe;
10709     PL_modcount         = proto_perl->Tmodcount;
10710     PL_lastgotoprobe    = Nullop;
10711     PL_dumpindent       = proto_perl->Tdumpindent;
10712
10713     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10714     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10715     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10716     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10717     PL_efloatbuf        = Nullch;               /* reinits on demand */
10718     PL_efloatsize       = 0;                    /* reinits on demand */
10719
10720     /* regex stuff */
10721
10722     PL_screamfirst      = NULL;
10723     PL_screamnext       = NULL;
10724     PL_maxscream        = -1;                   /* reinits on demand */
10725     PL_lastscream       = Nullsv;
10726
10727     PL_watchaddr        = NULL;
10728     PL_watchok          = Nullch;
10729
10730     PL_regdummy         = proto_perl->Tregdummy;
10731     PL_regprecomp       = Nullch;
10732     PL_regnpar          = 0;
10733     PL_regsize          = 0;
10734     PL_colorset         = 0;            /* reinits PL_colors[] */
10735     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10736     PL_reginput         = Nullch;
10737     PL_regbol           = Nullch;
10738     PL_regeol           = Nullch;
10739     PL_regstartp        = (I32*)NULL;
10740     PL_regendp          = (I32*)NULL;
10741     PL_reglastparen     = (U32*)NULL;
10742     PL_reglastcloseparen        = (U32*)NULL;
10743     PL_regtill          = Nullch;
10744     PL_reg_start_tmp    = (char**)NULL;
10745     PL_reg_start_tmpl   = 0;
10746     PL_regdata          = (struct reg_data*)NULL;
10747     PL_bostr            = Nullch;
10748     PL_reg_flags        = 0;
10749     PL_reg_eval_set     = 0;
10750     PL_regnarrate       = 0;
10751     PL_regprogram       = (regnode*)NULL;
10752     PL_regindent        = 0;
10753     PL_regcc            = (CURCUR*)NULL;
10754     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10755     PL_reg_re           = (regexp*)NULL;
10756     PL_reg_ganch        = Nullch;
10757     PL_reg_sv           = Nullsv;
10758     PL_reg_match_utf8   = FALSE;
10759     PL_reg_magic        = (MAGIC*)NULL;
10760     PL_reg_oldpos       = 0;
10761     PL_reg_oldcurpm     = (PMOP*)NULL;
10762     PL_reg_curpm        = (PMOP*)NULL;
10763     PL_reg_oldsaved     = Nullch;
10764     PL_reg_oldsavedlen  = 0;
10765 #ifdef PERL_OLD_COPY_ON_WRITE
10766     PL_nrs              = Nullsv;
10767 #endif
10768     PL_reg_maxiter      = 0;
10769     PL_reg_leftiter     = 0;
10770     PL_reg_poscache     = Nullch;
10771     PL_reg_poscache_size= 0;
10772
10773     /* RE engine - function pointers */
10774     PL_regcompp         = proto_perl->Tregcompp;
10775     PL_regexecp         = proto_perl->Tregexecp;
10776     PL_regint_start     = proto_perl->Tregint_start;
10777     PL_regint_string    = proto_perl->Tregint_string;
10778     PL_regfree          = proto_perl->Tregfree;
10779
10780     PL_reginterp_cnt    = 0;
10781     PL_reg_starttry     = 0;
10782
10783     /* Pluggable optimizer */
10784     PL_peepp            = proto_perl->Tpeepp;
10785
10786     PL_stashcache       = newHV();
10787
10788     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
10789         ptr_table_free(PL_ptr_table);
10790         PL_ptr_table = NULL;
10791     }
10792
10793     /* Call the ->CLONE method, if it exists, for each of the stashes
10794        identified by sv_dup() above.
10795     */
10796     while(av_len(param->stashes) != -1) {
10797         HV* const stash = (HV*) av_shift(param->stashes);
10798         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
10799         if (cloner && GvCV(cloner)) {
10800             dSP;
10801             ENTER;
10802             SAVETMPS;
10803             PUSHMARK(SP);
10804             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
10805             PUTBACK;
10806             call_sv((SV*)GvCV(cloner), G_DISCARD);
10807             FREETMPS;
10808             LEAVE;
10809         }
10810     }
10811
10812     SvREFCNT_dec(param->stashes);
10813
10814     /* orphaned? eg threads->new inside BEGIN or use */
10815     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
10816         (void)SvREFCNT_inc(PL_compcv);
10817         SAVEFREESV(PL_compcv);
10818     }
10819
10820     return my_perl;
10821 }
10822
10823 #endif /* USE_ITHREADS */
10824
10825 /*
10826 =head1 Unicode Support
10827
10828 =for apidoc sv_recode_to_utf8
10829
10830 The encoding is assumed to be an Encode object, on entry the PV
10831 of the sv is assumed to be octets in that encoding, and the sv
10832 will be converted into Unicode (and UTF-8).
10833
10834 If the sv already is UTF-8 (or if it is not POK), or if the encoding
10835 is not a reference, nothing is done to the sv.  If the encoding is not
10836 an C<Encode::XS> Encoding object, bad things will happen.
10837 (See F<lib/encoding.pm> and L<Encode>).
10838
10839 The PV of the sv is returned.
10840
10841 =cut */
10842
10843 char *
10844 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
10845 {
10846     dVAR;
10847     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
10848         SV *uni;
10849         STRLEN len;
10850         const char *s;
10851         dSP;
10852         ENTER;
10853         SAVETMPS;
10854         save_re_context();
10855         PUSHMARK(sp);
10856         EXTEND(SP, 3);
10857         XPUSHs(encoding);
10858         XPUSHs(sv);
10859 /*
10860   NI-S 2002/07/09
10861   Passing sv_yes is wrong - it needs to be or'ed set of constants
10862   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
10863   remove converted chars from source.
10864
10865   Both will default the value - let them.
10866
10867         XPUSHs(&PL_sv_yes);
10868 */
10869         PUTBACK;
10870         call_method("decode", G_SCALAR);
10871         SPAGAIN;
10872         uni = POPs;
10873         PUTBACK;
10874         s = SvPV_const(uni, len);
10875         if (s != SvPVX_const(sv)) {
10876             SvGROW(sv, len + 1);
10877             Move(s, SvPVX(sv), len + 1, char);
10878             SvCUR_set(sv, len);
10879         }
10880         FREETMPS;
10881         LEAVE;
10882         SvUTF8_on(sv);
10883         return SvPVX(sv);
10884     }
10885     return SvPOKp(sv) ? SvPVX(sv) : NULL;
10886 }
10887
10888 /*
10889 =for apidoc sv_cat_decode
10890
10891 The encoding is assumed to be an Encode object, the PV of the ssv is
10892 assumed to be octets in that encoding and decoding the input starts
10893 from the position which (PV + *offset) pointed to.  The dsv will be
10894 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
10895 when the string tstr appears in decoding output or the input ends on
10896 the PV of the ssv. The value which the offset points will be modified
10897 to the last input position on the ssv.
10898
10899 Returns TRUE if the terminator was found, else returns FALSE.
10900
10901 =cut */
10902
10903 bool
10904 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
10905                    SV *ssv, int *offset, char *tstr, int tlen)
10906 {
10907     dVAR;
10908     bool ret = FALSE;
10909     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
10910         SV *offsv;
10911         dSP;
10912         ENTER;
10913         SAVETMPS;
10914         save_re_context();
10915         PUSHMARK(sp);
10916         EXTEND(SP, 6);
10917         XPUSHs(encoding);
10918         XPUSHs(dsv);
10919         XPUSHs(ssv);
10920         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
10921         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
10922         PUTBACK;
10923         call_method("cat_decode", G_SCALAR);
10924         SPAGAIN;
10925         ret = SvTRUE(TOPs);
10926         *offset = SvIV(offsv);
10927         PUTBACK;
10928         FREETMPS;
10929         LEAVE;
10930     }
10931     else
10932         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
10933     return ret;
10934
10935 }
10936
10937 /* ---------------------------------------------------------------------
10938  *
10939  * support functions for report_uninit()
10940  */
10941
10942 /* the maxiumum size of array or hash where we will scan looking
10943  * for the undefined element that triggered the warning */
10944
10945 #define FUV_MAX_SEARCH_SIZE 1000
10946
10947 /* Look for an entry in the hash whose value has the same SV as val;
10948  * If so, return a mortal copy of the key. */
10949
10950 STATIC SV*
10951 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
10952 {
10953     dVAR;
10954     register HE **array;
10955     I32 i;
10956
10957     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
10958                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
10959         return Nullsv;
10960
10961     array = HvARRAY(hv);
10962
10963     for (i=HvMAX(hv); i>0; i--) {
10964         register HE *entry;
10965         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
10966             if (HeVAL(entry) != val)
10967                 continue;
10968             if (    HeVAL(entry) == &PL_sv_undef ||
10969                     HeVAL(entry) == &PL_sv_placeholder)
10970                 continue;
10971             if (!HeKEY(entry))
10972                 return Nullsv;
10973             if (HeKLEN(entry) == HEf_SVKEY)
10974                 return sv_mortalcopy(HeKEY_sv(entry));
10975             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
10976         }
10977     }
10978     return Nullsv;
10979 }
10980
10981 /* Look for an entry in the array whose value has the same SV as val;
10982  * If so, return the index, otherwise return -1. */
10983
10984 STATIC I32
10985 S_find_array_subscript(pTHX_ AV *av, SV* val)
10986 {
10987     SV** svp;
10988     I32 i;
10989     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
10990                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
10991         return -1;
10992
10993     svp = AvARRAY(av);
10994     for (i=AvFILLp(av); i>=0; i--) {
10995         if (svp[i] == val && svp[i] != &PL_sv_undef)
10996             return i;
10997     }
10998     return -1;
10999 }
11000
11001 /* S_varname(): return the name of a variable, optionally with a subscript.
11002  * If gv is non-zero, use the name of that global, along with gvtype (one
11003  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11004  * targ.  Depending on the value of the subscript_type flag, return:
11005  */
11006
11007 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11008 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11009 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11010 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11011
11012 STATIC SV*
11013 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11014         SV* keyname, I32 aindex, int subscript_type)
11015 {
11016
11017     SV * const name = sv_newmortal();
11018     if (gv) {
11019         char buffer[2];
11020         buffer[0] = gvtype;
11021         buffer[1] = 0;
11022
11023         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11024
11025         gv_fullname4(name, gv, buffer, 0);
11026
11027         if ((unsigned int)SvPVX(name)[1] <= 26) {
11028             buffer[0] = '^';
11029             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11030
11031             /* Swap the 1 unprintable control character for the 2 byte pretty
11032                version - ie substr($name, 1, 1) = $buffer; */
11033             sv_insert(name, 1, 1, buffer, 2);
11034         }
11035     }
11036     else {
11037         U32 unused;
11038         CV * const cv = find_runcv(&unused);
11039         SV *sv;
11040         AV *av;
11041
11042         if (!cv || !CvPADLIST(cv))
11043             return Nullsv;
11044         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11045         sv = *av_fetch(av, targ, FALSE);
11046         /* SvLEN in a pad name is not to be trusted */
11047         sv_setpv(name, SvPV_nolen_const(sv));
11048     }
11049
11050     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11051         SV * const sv = NEWSV(0,0);
11052         *SvPVX(name) = '$';
11053         Perl_sv_catpvf(aTHX_ name, "{%s}",
11054             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11055         SvREFCNT_dec(sv);
11056     }
11057     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11058         *SvPVX(name) = '$';
11059         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11060     }
11061     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11062         sv_insert(name, 0, 0,  "within ", 7);
11063
11064     return name;
11065 }
11066
11067
11068 /*
11069 =for apidoc find_uninit_var
11070
11071 Find the name of the undefined variable (if any) that caused the operator o
11072 to issue a "Use of uninitialized value" warning.
11073 If match is true, only return a name if it's value matches uninit_sv.
11074 So roughly speaking, if a unary operator (such as OP_COS) generates a
11075 warning, then following the direct child of the op may yield an
11076 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11077 other hand, with OP_ADD there are two branches to follow, so we only print
11078 the variable name if we get an exact match.
11079
11080 The name is returned as a mortal SV.
11081
11082 Assumes that PL_op is the op that originally triggered the error, and that
11083 PL_comppad/PL_curpad points to the currently executing pad.
11084
11085 =cut
11086 */
11087
11088 STATIC SV *
11089 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11090 {
11091     dVAR;
11092     SV *sv;
11093     AV *av;
11094     GV *gv;
11095     OP *o, *o2, *kid;
11096
11097     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11098                             uninit_sv == &PL_sv_placeholder)))
11099         return Nullsv;
11100
11101     switch (obase->op_type) {
11102
11103     case OP_RV2AV:
11104     case OP_RV2HV:
11105     case OP_PADAV:
11106     case OP_PADHV:
11107       {
11108         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11109         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11110         I32 index = 0;
11111         SV *keysv = Nullsv;
11112         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11113
11114         if (pad) { /* @lex, %lex */
11115             sv = PAD_SVl(obase->op_targ);
11116             gv = Nullgv;
11117         }
11118         else {
11119             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11120             /* @global, %global */
11121                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11122                 if (!gv)
11123                     break;
11124                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11125             }
11126             else /* @{expr}, %{expr} */
11127                 return find_uninit_var(cUNOPx(obase)->op_first,
11128                                                     uninit_sv, match);
11129         }
11130
11131         /* attempt to find a match within the aggregate */
11132         if (hash) {
11133             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11134             if (keysv)
11135                 subscript_type = FUV_SUBSCRIPT_HASH;
11136         }
11137         else {
11138             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11139             if (index >= 0)
11140                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11141         }
11142
11143         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11144             break;
11145
11146         return varname(gv, hash ? '%' : '@', obase->op_targ,
11147                                     keysv, index, subscript_type);
11148       }
11149
11150     case OP_PADSV:
11151         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11152             break;
11153         return varname(Nullgv, '$', obase->op_targ,
11154                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11155
11156     case OP_GVSV:
11157         gv = cGVOPx_gv(obase);
11158         if (!gv || (match && GvSV(gv) != uninit_sv))
11159             break;
11160         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11161
11162     case OP_AELEMFAST:
11163         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11164             if (match) {
11165                 SV **svp;
11166                 av = (AV*)PAD_SV(obase->op_targ);
11167                 if (!av || SvRMAGICAL(av))
11168                     break;
11169                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11170                 if (!svp || *svp != uninit_sv)
11171                     break;
11172             }
11173             return varname(Nullgv, '$', obase->op_targ,
11174                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11175         }
11176         else {
11177             gv = cGVOPx_gv(obase);
11178             if (!gv)
11179                 break;
11180             if (match) {
11181                 SV **svp;
11182                 av = GvAV(gv);
11183                 if (!av || SvRMAGICAL(av))
11184                     break;
11185                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11186                 if (!svp || *svp != uninit_sv)
11187                     break;
11188             }
11189             return varname(gv, '$', 0,
11190                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11191         }
11192         break;
11193
11194     case OP_EXISTS:
11195         o = cUNOPx(obase)->op_first;
11196         if (!o || o->op_type != OP_NULL ||
11197                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11198             break;
11199         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11200
11201     case OP_AELEM:
11202     case OP_HELEM:
11203         if (PL_op == obase)
11204             /* $a[uninit_expr] or $h{uninit_expr} */
11205             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11206
11207         gv = Nullgv;
11208         o = cBINOPx(obase)->op_first;
11209         kid = cBINOPx(obase)->op_last;
11210
11211         /* get the av or hv, and optionally the gv */
11212         sv = Nullsv;
11213         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11214             sv = PAD_SV(o->op_targ);
11215         }
11216         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11217                 && cUNOPo->op_first->op_type == OP_GV)
11218         {
11219             gv = cGVOPx_gv(cUNOPo->op_first);
11220             if (!gv)
11221                 break;
11222             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11223         }
11224         if (!sv)
11225             break;
11226
11227         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11228             /* index is constant */
11229             if (match) {
11230                 if (SvMAGICAL(sv))
11231                     break;
11232                 if (obase->op_type == OP_HELEM) {
11233                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11234                     if (!he || HeVAL(he) != uninit_sv)
11235                         break;
11236                 }
11237                 else {
11238                     SV * const * const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11239                     if (!svp || *svp != uninit_sv)
11240                         break;
11241                 }
11242             }
11243             if (obase->op_type == OP_HELEM)
11244                 return varname(gv, '%', o->op_targ,
11245                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11246             else
11247                 return varname(gv, '@', o->op_targ, Nullsv,
11248                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11249         }
11250         else  {
11251             /* index is an expression;
11252              * attempt to find a match within the aggregate */
11253             if (obase->op_type == OP_HELEM) {
11254                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11255                 if (keysv)
11256                     return varname(gv, '%', o->op_targ,
11257                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11258             }
11259             else {
11260                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11261                 if (index >= 0)
11262                     return varname(gv, '@', o->op_targ,
11263                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11264             }
11265             if (match)
11266                 break;
11267             return varname(gv,
11268                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11269                 ? '@' : '%',
11270                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11271         }
11272
11273         break;
11274
11275     case OP_AASSIGN:
11276         /* only examine RHS */
11277         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11278
11279     case OP_OPEN:
11280         o = cUNOPx(obase)->op_first;
11281         if (o->op_type == OP_PUSHMARK)
11282             o = o->op_sibling;
11283
11284         if (!o->op_sibling) {
11285             /* one-arg version of open is highly magical */
11286
11287             if (o->op_type == OP_GV) { /* open FOO; */
11288                 gv = cGVOPx_gv(o);
11289                 if (match && GvSV(gv) != uninit_sv)
11290                     break;
11291                 return varname(gv, '$', 0,
11292                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11293             }
11294             /* other possibilities not handled are:
11295              * open $x; or open my $x;  should return '${*$x}'
11296              * open expr;               should return '$'.expr ideally
11297              */
11298              break;
11299         }
11300         goto do_op;
11301
11302     /* ops where $_ may be an implicit arg */
11303     case OP_TRANS:
11304     case OP_SUBST:
11305     case OP_MATCH:
11306         if ( !(obase->op_flags & OPf_STACKED)) {
11307             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11308                                  ? PAD_SVl(obase->op_targ)
11309                                  : DEFSV))
11310             {
11311                 sv = sv_newmortal();
11312                 sv_setpvn(sv, "$_", 2);
11313                 return sv;
11314             }
11315         }
11316         goto do_op;
11317
11318     case OP_PRTF:
11319     case OP_PRINT:
11320         /* skip filehandle as it can't produce 'undef' warning  */
11321         o = cUNOPx(obase)->op_first;
11322         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11323             o = o->op_sibling->op_sibling;
11324         goto do_op2;
11325
11326
11327     case OP_RV2SV:
11328     case OP_CUSTOM:
11329     case OP_ENTERSUB:
11330         match = 1; /* XS or custom code could trigger random warnings */
11331         goto do_op;
11332
11333     case OP_SCHOMP:
11334     case OP_CHOMP:
11335         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11336             return sv_2mortal(newSVpvn("${$/}", 5));
11337         /* FALL THROUGH */
11338
11339     default:
11340     do_op:
11341         if (!(obase->op_flags & OPf_KIDS))
11342             break;
11343         o = cUNOPx(obase)->op_first;
11344         
11345     do_op2:
11346         if (!o)
11347             break;
11348
11349         /* if all except one arg are constant, or have no side-effects,
11350          * or are optimized away, then it's unambiguous */
11351         o2 = Nullop;
11352         for (kid=o; kid; kid = kid->op_sibling) {
11353             if (kid &&
11354                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11355                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11356                   || (kid->op_type == OP_PUSHMARK)
11357                 )
11358             )
11359                 continue;
11360             if (o2) { /* more than one found */
11361                 o2 = Nullop;
11362                 break;
11363             }
11364             o2 = kid;
11365         }
11366         if (o2)
11367             return find_uninit_var(o2, uninit_sv, match);
11368
11369         /* scan all args */
11370         while (o) {
11371             sv = find_uninit_var(o, uninit_sv, 1);
11372             if (sv)
11373                 return sv;
11374             o = o->op_sibling;
11375         }
11376         break;
11377     }
11378     return Nullsv;
11379 }
11380
11381
11382 /*
11383 =for apidoc report_uninit
11384
11385 Print appropriate "Use of uninitialized variable" warning
11386
11387 =cut
11388 */
11389
11390 void
11391 Perl_report_uninit(pTHX_ SV* uninit_sv)
11392 {
11393     if (PL_op) {
11394         SV* varname = Nullsv;
11395         if (uninit_sv) {
11396             varname = find_uninit_var(PL_op, uninit_sv,0);
11397             if (varname)
11398                 sv_insert(varname, 0, 0, " ", 1);
11399         }
11400         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11401                 varname ? SvPV_nolen_const(varname) : "",
11402                 " in ", OP_DESC(PL_op));
11403     }
11404     else
11405         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11406                     "", "", "");
11407 }
11408
11409 /*
11410  * Local variables:
11411  * c-indentation-style: bsd
11412  * c-basic-offset: 4
11413  * indent-tabs-mode: t
11414  * End:
11415  *
11416  * ex: set ts=8 sts=4 sw=4 noet:
11417  */