Remove tests that were not portable to 64bit ints.
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* const sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = Nullav;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void ** const arena_root    = &PL_body_arenaroots[sv_type];
644     void ** const root          = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void ** const r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void ** const thing_copy = (void **)thing;\
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      + relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
813      - relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      + relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
819      - relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      + relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
835      - relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      + relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
841      - relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s = SvPVX_const(sv);
1417           const char * const end = s + SvCUR(sv);
1418           for ( ; s < end && d < limit; s++ ) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 STATIC bool
1629 S_sv_2iuv_common(pTHX_ SV *sv) {
1630     if (SvNOKp(sv)) {
1631         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1632          * without also getting a cached IV/UV from it at the same time
1633          * (ie PV->NV conversion should detect loss of accuracy and cache
1634          * IV or UV at same time to avoid this. */
1635         /* IV-over-UV optimisation - choose to cache IV if possible */
1636
1637         if (SvTYPE(sv) == SVt_NV)
1638             sv_upgrade(sv, SVt_PVNV);
1639
1640         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1641         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1642            certainly cast into the IV range at IV_MAX, whereas the correct
1643            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1644            cases go to UV */
1645         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1646             SvIV_set(sv, I_V(SvNVX(sv)));
1647             if (SvNVX(sv) == (NV) SvIVX(sv)
1648 #ifndef NV_PRESERVES_UV
1649                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1650                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1651                 /* Don't flag it as "accurately an integer" if the number
1652                    came from a (by definition imprecise) NV operation, and
1653                    we're outside the range of NV integer precision */
1654 #endif
1655                 ) {
1656                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1657                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1658                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1659                                       PTR2UV(sv),
1660                                       SvNVX(sv),
1661                                       SvIVX(sv)));
1662
1663             } else {
1664                 /* IV not precise.  No need to convert from PV, as NV
1665                    conversion would already have cached IV if it detected
1666                    that PV->IV would be better than PV->NV->IV
1667                    flags already correct - don't set public IOK.  */
1668                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1669                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1670                                       PTR2UV(sv),
1671                                       SvNVX(sv),
1672                                       SvIVX(sv)));
1673             }
1674             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1675                but the cast (NV)IV_MIN rounds to a the value less (more
1676                negative) than IV_MIN which happens to be equal to SvNVX ??
1677                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1678                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1679                (NV)UVX == NVX are both true, but the values differ. :-(
1680                Hopefully for 2s complement IV_MIN is something like
1681                0x8000000000000000 which will be exact. NWC */
1682         }
1683         else {
1684             SvUV_set(sv, U_V(SvNVX(sv)));
1685             if (
1686                 (SvNVX(sv) == (NV) SvUVX(sv))
1687 #ifndef  NV_PRESERVES_UV
1688                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1689                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1690                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1691                 /* Don't flag it as "accurately an integer" if the number
1692                    came from a (by definition imprecise) NV operation, and
1693                    we're outside the range of NV integer precision */
1694 #endif
1695                 )
1696                 SvIOK_on(sv);
1697             SvIsUV_on(sv);
1698             DEBUG_c(PerlIO_printf(Perl_debug_log,
1699                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1700                                   PTR2UV(sv),
1701                                   SvUVX(sv),
1702                                   SvUVX(sv)));
1703         }
1704     }
1705     else if (SvPOKp(sv) && SvLEN(sv)) {
1706         UV value;
1707         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1708         /* We want to avoid a possible problem when we cache an IV/ a UV which
1709            may be later translated to an NV, and the resulting NV is not
1710            the same as the direct translation of the initial string
1711            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1712            be careful to ensure that the value with the .456 is around if the
1713            NV value is requested in the future).
1714         
1715            This means that if we cache such an IV/a UV, we need to cache the
1716            NV as well.  Moreover, we trade speed for space, and do not
1717            cache the NV if we are sure it's not needed.
1718          */
1719
1720         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1721         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1722              == IS_NUMBER_IN_UV) {
1723             /* It's definitely an integer, only upgrade to PVIV */
1724             if (SvTYPE(sv) < SVt_PVIV)
1725                 sv_upgrade(sv, SVt_PVIV);
1726             (void)SvIOK_on(sv);
1727         } else if (SvTYPE(sv) < SVt_PVNV)
1728             sv_upgrade(sv, SVt_PVNV);
1729
1730         /* If NV preserves UV then we only use the UV value if we know that
1731            we aren't going to call atof() below. If NVs don't preserve UVs
1732            then the value returned may have more precision than atof() will
1733            return, even though value isn't perfectly accurate.  */
1734         if ((numtype & (IS_NUMBER_IN_UV
1735 #ifdef NV_PRESERVES_UV
1736                         | IS_NUMBER_NOT_INT
1737 #endif
1738             )) == IS_NUMBER_IN_UV) {
1739             /* This won't turn off the public IOK flag if it was set above  */
1740             (void)SvIOKp_on(sv);
1741
1742             if (!(numtype & IS_NUMBER_NEG)) {
1743                 /* positive */;
1744                 if (value <= (UV)IV_MAX) {
1745                     SvIV_set(sv, (IV)value);
1746                 } else {
1747                     /* it didn't overflow, and it was positive. */
1748                     SvUV_set(sv, value);
1749                     SvIsUV_on(sv);
1750                 }
1751             } else {
1752                 /* 2s complement assumption  */
1753                 if (value <= (UV)IV_MIN) {
1754                     SvIV_set(sv, -(IV)value);
1755                 } else {
1756                     /* Too negative for an IV.  This is a double upgrade, but
1757                        I'm assuming it will be rare.  */
1758                     if (SvTYPE(sv) < SVt_PVNV)
1759                         sv_upgrade(sv, SVt_PVNV);
1760                     SvNOK_on(sv);
1761                     SvIOK_off(sv);
1762                     SvIOKp_on(sv);
1763                     SvNV_set(sv, -(NV)value);
1764                     SvIV_set(sv, IV_MIN);
1765                 }
1766             }
1767         }
1768         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1769            will be in the previous block to set the IV slot, and the next
1770            block to set the NV slot.  So no else here.  */
1771         
1772         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1773             != IS_NUMBER_IN_UV) {
1774             /* It wasn't an (integer that doesn't overflow the UV). */
1775             SvNV_set(sv, Atof(SvPVX_const(sv)));
1776
1777             if (! numtype && ckWARN(WARN_NUMERIC))
1778                 not_a_number(sv);
1779
1780 #if defined(USE_LONG_DOUBLE)
1781             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1782                                   PTR2UV(sv), SvNVX(sv)));
1783 #else
1784             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1785                                   PTR2UV(sv), SvNVX(sv)));
1786 #endif
1787
1788 #ifdef NV_PRESERVES_UV
1789             (void)SvIOKp_on(sv);
1790             (void)SvNOK_on(sv);
1791             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1792                 SvIV_set(sv, I_V(SvNVX(sv)));
1793                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1794                     SvIOK_on(sv);
1795                 } else {
1796                     /* Integer is imprecise. NOK, IOKp */
1797                 }
1798                 /* UV will not work better than IV */
1799             } else {
1800                 if (SvNVX(sv) > (NV)UV_MAX) {
1801                     SvIsUV_on(sv);
1802                     /* Integer is inaccurate. NOK, IOKp, is UV */
1803                     SvUV_set(sv, UV_MAX);
1804                 } else {
1805                     SvUV_set(sv, U_V(SvNVX(sv)));
1806                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
1807                        NV preservse UV so can do correct comparison.  */
1808                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1809                         SvIOK_on(sv);
1810                     } else {
1811                         /* Integer is imprecise. NOK, IOKp, is UV */
1812                     }
1813                 }
1814                 SvIsUV_on(sv);
1815             }
1816 #else /* NV_PRESERVES_UV */
1817             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1818                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1819                 /* The IV/UV slot will have been set from value returned by
1820                    grok_number above.  The NV slot has just been set using
1821                    Atof.  */
1822                 SvNOK_on(sv);
1823                 assert (SvIOKp(sv));
1824             } else {
1825                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1826                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1827                     /* Small enough to preserve all bits. */
1828                     (void)SvIOKp_on(sv);
1829                     SvNOK_on(sv);
1830                     SvIV_set(sv, I_V(SvNVX(sv)));
1831                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1832                         SvIOK_on(sv);
1833                     /* Assumption: first non-preserved integer is < IV_MAX,
1834                        this NV is in the preserved range, therefore: */
1835                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1836                           < (UV)IV_MAX)) {
1837                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1838                     }
1839                 } else {
1840                     /* IN_UV NOT_INT
1841                          0      0       already failed to read UV.
1842                          0      1       already failed to read UV.
1843                          1      0       you won't get here in this case. IV/UV
1844                                         slot set, public IOK, Atof() unneeded.
1845                          1      1       already read UV.
1846                        so there's no point in sv_2iuv_non_preserve() attempting
1847                        to use atol, strtol, strtoul etc.  */
1848                     sv_2iuv_non_preserve (sv, numtype);
1849                 }
1850             }
1851 #endif /* NV_PRESERVES_UV */
1852         }
1853     }
1854     else  {
1855         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1856             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1857                 report_uninit(sv);
1858         }
1859         if (SvTYPE(sv) < SVt_IV)
1860             /* Typically the caller expects that sv_any is not NULL now.  */
1861             sv_upgrade(sv, SVt_IV);
1862         /* Return 0 from the caller.  */
1863         return TRUE;
1864     }
1865     return FALSE;
1866 }
1867
1868 /*
1869 =for apidoc sv_2iv_flags
1870
1871 Return the integer value of an SV, doing any necessary string
1872 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1873 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1874
1875 =cut
1876 */
1877
1878 IV
1879 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1880 {
1881     if (!sv)
1882         return 0;
1883     if (SvGMAGICAL(sv)) {
1884         if (flags & SV_GMAGIC)
1885             mg_get(sv);
1886         if (SvIOKp(sv))
1887             return SvIVX(sv);
1888         if (SvNOKp(sv)) {
1889             return I_V(SvNVX(sv));
1890         }
1891         if (SvPOKp(sv) && SvLEN(sv))
1892             return asIV(sv);
1893         if (!SvROK(sv)) {
1894             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1895                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1896                     report_uninit(sv);
1897             }
1898             return 0;
1899         }
1900     }
1901     if (SvTHINKFIRST(sv)) {
1902         if (SvROK(sv)) {
1903             if (SvAMAGIC(sv)) {
1904                 SV * const tmpstr=AMG_CALLun(sv,numer);
1905                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1906                     return SvIV(tmpstr);
1907                 }
1908             }
1909             return PTR2IV(SvRV(sv));
1910         }
1911         if (SvIsCOW(sv)) {
1912             sv_force_normal_flags(sv, 0);
1913         }
1914         if (SvREADONLY(sv) && !SvOK(sv)) {
1915             if (ckWARN(WARN_UNINITIALIZED))
1916                 report_uninit(sv);
1917             return 0;
1918         }
1919     }
1920     if (!SvIOKp(sv)) {
1921         if (S_sv_2iuv_common(aTHX_ sv))
1922             return 0;
1923     }
1924     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1925         PTR2UV(sv),SvIVX(sv)));
1926     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1927 }
1928
1929 /*
1930 =for apidoc sv_2uv_flags
1931
1932 Return the unsigned integer value of an SV, doing any necessary string
1933 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1934 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1935
1936 =cut
1937 */
1938
1939 UV
1940 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1941 {
1942     if (!sv)
1943         return 0;
1944     if (SvGMAGICAL(sv)) {
1945         if (flags & SV_GMAGIC)
1946             mg_get(sv);
1947         if (SvIOKp(sv))
1948             return SvUVX(sv);
1949         if (SvNOKp(sv))
1950             return U_V(SvNVX(sv));
1951         if (SvPOKp(sv) && SvLEN(sv))
1952             return asUV(sv);
1953         if (!SvROK(sv)) {
1954             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1955                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1956                     report_uninit(sv);
1957             }
1958             return 0;
1959         }
1960     }
1961     if (SvTHINKFIRST(sv)) {
1962         if (SvROK(sv)) {
1963           SV* tmpstr;
1964           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
1965                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
1966               return SvUV(tmpstr);
1967           return PTR2UV(SvRV(sv));
1968         }
1969         if (SvIsCOW(sv)) {
1970             sv_force_normal_flags(sv, 0);
1971         }
1972         if (SvREADONLY(sv) && !SvOK(sv)) {
1973             if (ckWARN(WARN_UNINITIALIZED))
1974                 report_uninit(sv);
1975             return 0;
1976         }
1977     }
1978     if (!SvIOKp(sv)) {
1979         if (S_sv_2iuv_common(aTHX_ sv))
1980             return 0;
1981     }
1982
1983     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
1984                           PTR2UV(sv),SvUVX(sv)));
1985     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
1986 }
1987
1988 /*
1989 =for apidoc sv_2nv
1990
1991 Return the num value of an SV, doing any necessary string or integer
1992 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
1993 macros.
1994
1995 =cut
1996 */
1997
1998 NV
1999 Perl_sv_2nv(pTHX_ register SV *sv)
2000 {
2001     if (!sv)
2002         return 0.0;
2003     if (SvGMAGICAL(sv)) {
2004         mg_get(sv);
2005         if (SvNOKp(sv))
2006             return SvNVX(sv);
2007         if (SvPOKp(sv) && SvLEN(sv)) {
2008             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2009                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2010                 not_a_number(sv);
2011             return Atof(SvPVX_const(sv));
2012         }
2013         if (SvIOKp(sv)) {
2014             if (SvIsUV(sv))
2015                 return (NV)SvUVX(sv);
2016             else
2017                 return (NV)SvIVX(sv);
2018         }       
2019         if (!SvROK(sv)) {
2020             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2021                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2022                     report_uninit(sv);
2023             }
2024             return (NV)0;
2025         }
2026     }
2027     if (SvTHINKFIRST(sv)) {
2028         if (SvROK(sv)) {
2029           SV* tmpstr;
2030           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2031                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2032               return SvNV(tmpstr);
2033           return PTR2NV(SvRV(sv));
2034         }
2035         if (SvIsCOW(sv)) {
2036             sv_force_normal_flags(sv, 0);
2037         }
2038         if (SvREADONLY(sv) && !SvOK(sv)) {
2039             if (ckWARN(WARN_UNINITIALIZED))
2040                 report_uninit(sv);
2041             return 0.0;
2042         }
2043     }
2044     if (SvTYPE(sv) < SVt_NV) {
2045         if (SvTYPE(sv) == SVt_IV)
2046             sv_upgrade(sv, SVt_PVNV);
2047         else
2048             sv_upgrade(sv, SVt_NV);
2049 #ifdef USE_LONG_DOUBLE
2050         DEBUG_c({
2051             STORE_NUMERIC_LOCAL_SET_STANDARD();
2052             PerlIO_printf(Perl_debug_log,
2053                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2054                           PTR2UV(sv), SvNVX(sv));
2055             RESTORE_NUMERIC_LOCAL();
2056         });
2057 #else
2058         DEBUG_c({
2059             STORE_NUMERIC_LOCAL_SET_STANDARD();
2060             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2061                           PTR2UV(sv), SvNVX(sv));
2062             RESTORE_NUMERIC_LOCAL();
2063         });
2064 #endif
2065     }
2066     else if (SvTYPE(sv) < SVt_PVNV)
2067         sv_upgrade(sv, SVt_PVNV);
2068     if (SvNOKp(sv)) {
2069         return SvNVX(sv);
2070     }
2071     if (SvIOKp(sv)) {
2072         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2073 #ifdef NV_PRESERVES_UV
2074         SvNOK_on(sv);
2075 #else
2076         /* Only set the public NV OK flag if this NV preserves the IV  */
2077         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2078         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2079                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2080             SvNOK_on(sv);
2081         else
2082             SvNOKp_on(sv);
2083 #endif
2084     }
2085     else if (SvPOKp(sv) && SvLEN(sv)) {
2086         UV value;
2087         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2088         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2089             not_a_number(sv);
2090 #ifdef NV_PRESERVES_UV
2091         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2092             == IS_NUMBER_IN_UV) {
2093             /* It's definitely an integer */
2094             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2095         } else
2096             SvNV_set(sv, Atof(SvPVX_const(sv)));
2097         SvNOK_on(sv);
2098 #else
2099         SvNV_set(sv, Atof(SvPVX_const(sv)));
2100         /* Only set the public NV OK flag if this NV preserves the value in
2101            the PV at least as well as an IV/UV would.
2102            Not sure how to do this 100% reliably. */
2103         /* if that shift count is out of range then Configure's test is
2104            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2105            UV_BITS */
2106         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2107             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2108             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2109         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2110             /* Can't use strtol etc to convert this string, so don't try.
2111                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2112             SvNOK_on(sv);
2113         } else {
2114             /* value has been set.  It may not be precise.  */
2115             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2116                 /* 2s complement assumption for (UV)IV_MIN  */
2117                 SvNOK_on(sv); /* Integer is too negative.  */
2118             } else {
2119                 SvNOKp_on(sv);
2120                 SvIOKp_on(sv);
2121
2122                 if (numtype & IS_NUMBER_NEG) {
2123                     SvIV_set(sv, -(IV)value);
2124                 } else if (value <= (UV)IV_MAX) {
2125                     SvIV_set(sv, (IV)value);
2126                 } else {
2127                     SvUV_set(sv, value);
2128                     SvIsUV_on(sv);
2129                 }
2130
2131                 if (numtype & IS_NUMBER_NOT_INT) {
2132                     /* I believe that even if the original PV had decimals,
2133                        they are lost beyond the limit of the FP precision.
2134                        However, neither is canonical, so both only get p
2135                        flags.  NWC, 2000/11/25 */
2136                     /* Both already have p flags, so do nothing */
2137                 } else {
2138                     const NV nv = SvNVX(sv);
2139                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2140                         if (SvIVX(sv) == I_V(nv)) {
2141                             SvNOK_on(sv);
2142                         } else {
2143                             /* It had no "." so it must be integer.  */
2144                         }
2145                         SvIOK_on(sv);
2146                     } else {
2147                         /* between IV_MAX and NV(UV_MAX).
2148                            Could be slightly > UV_MAX */
2149
2150                         if (numtype & IS_NUMBER_NOT_INT) {
2151                             /* UV and NV both imprecise.  */
2152                         } else {
2153                             const UV nv_as_uv = U_V(nv);
2154
2155                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2156                                 SvNOK_on(sv);
2157                             }
2158                             SvIOK_on(sv);
2159                         }
2160                     }
2161                 }
2162             }
2163         }
2164 #endif /* NV_PRESERVES_UV */
2165     }
2166     else  {
2167         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2168             report_uninit(sv);
2169         if (SvTYPE(sv) < SVt_NV)
2170             /* Typically the caller expects that sv_any is not NULL now.  */
2171             /* XXX Ilya implies that this is a bug in callers that assume this
2172                and ideally should be fixed.  */
2173             sv_upgrade(sv, SVt_NV);
2174         return 0.0;
2175     }
2176 #if defined(USE_LONG_DOUBLE)
2177     DEBUG_c({
2178         STORE_NUMERIC_LOCAL_SET_STANDARD();
2179         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2180                       PTR2UV(sv), SvNVX(sv));
2181         RESTORE_NUMERIC_LOCAL();
2182     });
2183 #else
2184     DEBUG_c({
2185         STORE_NUMERIC_LOCAL_SET_STANDARD();
2186         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2187                       PTR2UV(sv), SvNVX(sv));
2188         RESTORE_NUMERIC_LOCAL();
2189     });
2190 #endif
2191     return SvNVX(sv);
2192 }
2193
2194 /* asIV(): extract an integer from the string value of an SV.
2195  * Caller must validate PVX  */
2196
2197 STATIC IV
2198 S_asIV(pTHX_ SV *sv)
2199 {
2200     UV value;
2201     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2202
2203     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2204         == IS_NUMBER_IN_UV) {
2205         /* It's definitely an integer */
2206         if (numtype & IS_NUMBER_NEG) {
2207             if (value < (UV)IV_MIN)
2208                 return -(IV)value;
2209         } else {
2210             if (value < (UV)IV_MAX)
2211                 return (IV)value;
2212         }
2213     }
2214     if (!numtype) {
2215         if (ckWARN(WARN_NUMERIC))
2216             not_a_number(sv);
2217     }
2218     return I_V(Atof(SvPVX_const(sv)));
2219 }
2220
2221 /* asUV(): extract an unsigned integer from the string value of an SV
2222  * Caller must validate PVX  */
2223
2224 STATIC UV
2225 S_asUV(pTHX_ SV *sv)
2226 {
2227     UV value;
2228     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2229
2230     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2231         == IS_NUMBER_IN_UV) {
2232         /* It's definitely an integer */
2233         if (!(numtype & IS_NUMBER_NEG))
2234             return value;
2235     }
2236     if (!numtype) {
2237         if (ckWARN(WARN_NUMERIC))
2238             not_a_number(sv);
2239     }
2240     return U_V(Atof(SvPVX_const(sv)));
2241 }
2242
2243 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2244  * UV as a string towards the end of buf, and return pointers to start and
2245  * end of it.
2246  *
2247  * We assume that buf is at least TYPE_CHARS(UV) long.
2248  */
2249
2250 static char *
2251 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2252 {
2253     char *ptr = buf + TYPE_CHARS(UV);
2254     char * const ebuf = ptr;
2255     int sign;
2256
2257     if (is_uv)
2258         sign = 0;
2259     else if (iv >= 0) {
2260         uv = iv;
2261         sign = 0;
2262     } else {
2263         uv = -iv;
2264         sign = 1;
2265     }
2266     do {
2267         *--ptr = '0' + (char)(uv % 10);
2268     } while (uv /= 10);
2269     if (sign)
2270         *--ptr = '-';
2271     *peob = ebuf;
2272     return ptr;
2273 }
2274
2275 /* stringify_regexp(): private routine for use by sv_2pv_flags(): converts
2276  * a regexp to its stringified form.
2277  */
2278
2279 static char *
2280 S_stringify_regexp(pTHX_ SV *sv, MAGIC *mg, STRLEN *lp) {
2281     const regexp * const re = (regexp *)mg->mg_obj;
2282
2283     if (!mg->mg_ptr) {
2284         const char *fptr = "msix";
2285         char reflags[6];
2286         char ch;
2287         int left = 0;
2288         int right = 4;
2289         bool need_newline = 0;
2290         U16 reganch = (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2291
2292         while((ch = *fptr++)) {
2293             if(reganch & 1) {
2294                 reflags[left++] = ch;
2295             }
2296             else {
2297                 reflags[right--] = ch;
2298             }
2299             reganch >>= 1;
2300         }
2301         if(left != 4) {
2302             reflags[left] = '-';
2303             left = 5;
2304         }
2305
2306         mg->mg_len = re->prelen + 4 + left;
2307         /*
2308          * If /x was used, we have to worry about a regex ending with a
2309          * comment later being embedded within another regex. If so, we don't
2310          * want this regex's "commentization" to leak out to the right part of
2311          * the enclosing regex, we must cap it with a newline.
2312          *
2313          * So, if /x was used, we scan backwards from the end of the regex. If
2314          * we find a '#' before we find a newline, we need to add a newline
2315          * ourself. If we find a '\n' first (or if we don't find '#' or '\n'),
2316          * we don't need to add anything.  -jfriedl
2317          */
2318         if (PMf_EXTENDED & re->reganch) {
2319             const char *endptr = re->precomp + re->prelen;
2320             while (endptr >= re->precomp) {
2321                 const char c = *(endptr--);
2322                 if (c == '\n')
2323                     break; /* don't need another */
2324                 if (c == '#') {
2325                     /* we end while in a comment, so we need a newline */
2326                     mg->mg_len++; /* save space for it */
2327                     need_newline = 1; /* note to add it */
2328                     break;
2329                 }
2330             }
2331         }
2332
2333         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2334         mg->mg_ptr[0] = '(';
2335         mg->mg_ptr[1] = '?';
2336         Copy(reflags, mg->mg_ptr+2, left, char);
2337         *(mg->mg_ptr+left+2) = ':';
2338         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2339         if (need_newline)
2340             mg->mg_ptr[mg->mg_len - 2] = '\n';
2341         mg->mg_ptr[mg->mg_len - 1] = ')';
2342         mg->mg_ptr[mg->mg_len] = 0;
2343     }
2344     PL_reginterp_cnt += re->program[0].next_off;
2345     
2346     if (re->reganch & ROPT_UTF8)
2347         SvUTF8_on(sv);
2348     else
2349         SvUTF8_off(sv);
2350     if (lp)
2351         *lp = mg->mg_len;
2352     return mg->mg_ptr;
2353 }
2354
2355 /*
2356 =for apidoc sv_2pv_flags
2357
2358 Returns a pointer to the string value of an SV, and sets *lp to its length.
2359 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2360 if necessary.
2361 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2362 usually end up here too.
2363
2364 =cut
2365 */
2366
2367 char *
2368 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2369 {
2370     register char *s;
2371     int olderrno;
2372
2373     if (!sv) {
2374         if (lp)
2375             *lp = 0;
2376         return (char *)"";
2377     }
2378     if (SvGMAGICAL(sv)) {
2379         if (flags & SV_GMAGIC)
2380             mg_get(sv);
2381         if (SvPOKp(sv)) {
2382             if (lp)
2383                 *lp = SvCUR(sv);
2384             if (flags & SV_MUTABLE_RETURN)
2385                 return SvPVX_mutable(sv);
2386             if (flags & SV_CONST_RETURN)
2387                 return (char *)SvPVX_const(sv);
2388             return SvPVX(sv);
2389         }
2390         if (SvIOKp(sv) || SvNOKp(sv)) {
2391             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2392             STRLEN len;
2393
2394             if (SvIOKp(sv)) {
2395                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2396                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2397             } else {
2398                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2399                 len = strlen(tbuf);
2400             }
2401             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2402                 /* Sneaky stuff here */
2403                 SV * const tsv = newSVpvn(tbuf, len);
2404
2405                 sv_2mortal(tsv);
2406                 if (lp)
2407                     *lp = SvCUR(tsv);
2408                 return SvPVX(tsv);
2409             }
2410             else {
2411                 dVAR;
2412
2413 #ifdef FIXNEGATIVEZERO
2414                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2415                     tbuf[0] = '0';
2416                     tbuf[1] = 0;
2417                     len = 1;
2418                 }
2419 #endif
2420                 SvUPGRADE(sv, SVt_PV);
2421                 if (lp)
2422                     *lp = len;
2423                 s = SvGROW_mutable(sv, len + 1);
2424                 SvCUR_set(sv, len);
2425                 SvPOKp_on(sv);
2426                 return memcpy(s, tbuf, len + 1);
2427             }
2428         }
2429         if (!SvROK(sv)) {
2430             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2431                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2432                     report_uninit(sv);
2433             }
2434             if (lp)
2435                 *lp = 0;
2436             return (char *)"";
2437         }
2438     }
2439     if (SvTHINKFIRST(sv)) {
2440         if (SvROK(sv)) {
2441             SV* tmpstr;
2442
2443             if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,string)) &&
2444                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2445                 /* Unwrap this:  */
2446                 /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr); */
2447
2448                 char *pv;
2449                 if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2450                     if (flags & SV_CONST_RETURN) {
2451                         pv = (char *) SvPVX_const(tmpstr);
2452                     } else {
2453                         pv = (flags & SV_MUTABLE_RETURN)
2454                             ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2455                     }
2456                     if (lp)
2457                         *lp = SvCUR(tmpstr);
2458                 } else {
2459                     pv = sv_2pv_flags(tmpstr, lp, flags);
2460                 }
2461                 if (SvUTF8(tmpstr))
2462                     SvUTF8_on(sv);
2463                 else
2464                     SvUTF8_off(sv);
2465                 return pv;
2466             } else {
2467                 SV *tsv;
2468                 MAGIC *mg;
2469                 const SV *const referent = (SV*)SvRV(sv);
2470
2471                 if (!referent) {
2472                     tsv = sv_2mortal(newSVpvn("NULLREF", 7));
2473                 } else if (SvTYPE(referent) == SVt_PVMG
2474                            && ((SvFLAGS(referent) &
2475                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2476                                == (SVs_OBJECT|SVs_SMG))
2477                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2478                     return S_stringify_regexp(aTHX_ sv, mg, lp);
2479                 } else {
2480                     const char *const typestr = sv_reftype(referent, 0);
2481
2482                     tsv = sv_newmortal();
2483                     if (SvOBJECT(referent)) {
2484                         const char *const name = HvNAME_get(SvSTASH(referent));
2485                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2486                                        name ? name : "__ANON__" , typestr,
2487                                        PTR2UV(referent));
2488                     }
2489                     else
2490                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2491                                        PTR2UV(referent));
2492                 }
2493                 if (lp)
2494                     *lp = SvCUR(tsv);
2495                 return SvPVX(tsv);
2496             }
2497         }
2498         if (SvREADONLY(sv) && !SvOK(sv)) {
2499             if (ckWARN(WARN_UNINITIALIZED))
2500                 report_uninit(sv);
2501             if (lp)
2502                 *lp = 0;
2503             return (char *)"";
2504         }
2505     }
2506     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2507         /* I'm assuming that if both IV and NV are equally valid then
2508            converting the IV is going to be more efficient */
2509         const U32 isIOK = SvIOK(sv);
2510         const U32 isUIOK = SvIsUV(sv);
2511         char buf[TYPE_CHARS(UV)];
2512         char *ebuf, *ptr;
2513
2514         if (SvTYPE(sv) < SVt_PVIV)
2515             sv_upgrade(sv, SVt_PVIV);
2516         if (isUIOK)
2517             ptr = uiv_2buf(buf, 0, SvUVX(sv), 1, &ebuf);
2518         else
2519             ptr = uiv_2buf(buf, SvIVX(sv), 0, 0, &ebuf);
2520         /* inlined from sv_setpvn */
2521         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2522         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2523         SvCUR_set(sv, ebuf - ptr);
2524         s = SvEND(sv);
2525         *s = '\0';
2526         if (isIOK)
2527             SvIOK_on(sv);
2528         else
2529             SvIOKp_on(sv);
2530         if (isUIOK)
2531             SvIsUV_on(sv);
2532     }
2533     else if (SvNOKp(sv)) {
2534         if (SvTYPE(sv) < SVt_PVNV)
2535             sv_upgrade(sv, SVt_PVNV);
2536         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2537         s = SvGROW_mutable(sv, NV_DIG + 20);
2538         olderrno = errno;       /* some Xenix systems wipe out errno here */
2539 #ifdef apollo
2540         if (SvNVX(sv) == 0.0)
2541             (void)strcpy(s,"0");
2542         else
2543 #endif /*apollo*/
2544         {
2545             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2546         }
2547         errno = olderrno;
2548 #ifdef FIXNEGATIVEZERO
2549         if (*s == '-' && s[1] == '0' && !s[2])
2550             strcpy(s,"0");
2551 #endif
2552         while (*s) s++;
2553 #ifdef hcx
2554         if (s[-1] == '.')
2555             *--s = '\0';
2556 #endif
2557     }
2558     else {
2559         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2560             report_uninit(sv);
2561         if (lp)
2562             *lp = 0;
2563         if (SvTYPE(sv) < SVt_PV)
2564             /* Typically the caller expects that sv_any is not NULL now.  */
2565             sv_upgrade(sv, SVt_PV);
2566         return (char *)"";
2567     }
2568     {
2569         const STRLEN len = s - SvPVX_const(sv);
2570         if (lp) 
2571             *lp = len;
2572         SvCUR_set(sv, len);
2573     }
2574     SvPOK_on(sv);
2575     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2576                           PTR2UV(sv),SvPVX_const(sv)));
2577     if (flags & SV_CONST_RETURN)
2578         return (char *)SvPVX_const(sv);
2579     if (flags & SV_MUTABLE_RETURN)
2580         return SvPVX_mutable(sv);
2581     return SvPVX(sv);
2582 }
2583
2584 /*
2585 =for apidoc sv_copypv
2586
2587 Copies a stringified representation of the source SV into the
2588 destination SV.  Automatically performs any necessary mg_get and
2589 coercion of numeric values into strings.  Guaranteed to preserve
2590 UTF-8 flag even from overloaded objects.  Similar in nature to
2591 sv_2pv[_flags] but operates directly on an SV instead of just the
2592 string.  Mostly uses sv_2pv_flags to do its work, except when that
2593 would lose the UTF-8'ness of the PV.
2594
2595 =cut
2596 */
2597
2598 void
2599 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2600 {
2601     STRLEN len;
2602     const char * const s = SvPV_const(ssv,len);
2603     sv_setpvn(dsv,s,len);
2604     if (SvUTF8(ssv))
2605         SvUTF8_on(dsv);
2606     else
2607         SvUTF8_off(dsv);
2608 }
2609
2610 /*
2611 =for apidoc sv_2pvbyte
2612
2613 Return a pointer to the byte-encoded representation of the SV, and set *lp
2614 to its length.  May cause the SV to be downgraded from UTF-8 as a
2615 side-effect.
2616
2617 Usually accessed via the C<SvPVbyte> macro.
2618
2619 =cut
2620 */
2621
2622 char *
2623 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2624 {
2625     sv_utf8_downgrade(sv,0);
2626     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2627 }
2628
2629 /*
2630 =for apidoc sv_2pvutf8
2631
2632 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2633 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2634
2635 Usually accessed via the C<SvPVutf8> macro.
2636
2637 =cut
2638 */
2639
2640 char *
2641 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2642 {
2643     sv_utf8_upgrade(sv);
2644     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2645 }
2646
2647
2648 /*
2649 =for apidoc sv_2bool
2650
2651 This function is only called on magical items, and is only used by
2652 sv_true() or its macro equivalent.
2653
2654 =cut
2655 */
2656
2657 bool
2658 Perl_sv_2bool(pTHX_ register SV *sv)
2659 {
2660     SvGETMAGIC(sv);
2661
2662     if (!SvOK(sv))
2663         return 0;
2664     if (SvROK(sv)) {
2665         SV* tmpsv;
2666         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2667                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2668             return (bool)SvTRUE(tmpsv);
2669       return SvRV(sv) != 0;
2670     }
2671     if (SvPOKp(sv)) {
2672         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2673         if (Xpvtmp &&
2674                 (*sv->sv_u.svu_pv > '0' ||
2675                 Xpvtmp->xpv_cur > 1 ||
2676                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2677             return 1;
2678         else
2679             return 0;
2680     }
2681     else {
2682         if (SvIOKp(sv))
2683             return SvIVX(sv) != 0;
2684         else {
2685             if (SvNOKp(sv))
2686                 return SvNVX(sv) != 0.0;
2687             else
2688                 return FALSE;
2689         }
2690     }
2691 }
2692
2693 /*
2694 =for apidoc sv_utf8_upgrade
2695
2696 Converts the PV of an SV to its UTF-8-encoded form.
2697 Forces the SV to string form if it is not already.
2698 Always sets the SvUTF8 flag to avoid future validity checks even
2699 if all the bytes have hibit clear.
2700
2701 This is not as a general purpose byte encoding to Unicode interface:
2702 use the Encode extension for that.
2703
2704 =for apidoc sv_utf8_upgrade_flags
2705
2706 Converts the PV of an SV to its UTF-8-encoded form.
2707 Forces the SV to string form if it is not already.
2708 Always sets the SvUTF8 flag to avoid future validity checks even
2709 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2710 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2711 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2712
2713 This is not as a general purpose byte encoding to Unicode interface:
2714 use the Encode extension for that.
2715
2716 =cut
2717 */
2718
2719 STRLEN
2720 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2721 {
2722     if (sv == &PL_sv_undef)
2723         return 0;
2724     if (!SvPOK(sv)) {
2725         STRLEN len = 0;
2726         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2727             (void) sv_2pv_flags(sv,&len, flags);
2728             if (SvUTF8(sv))
2729                 return len;
2730         } else {
2731             (void) SvPV_force(sv,len);
2732         }
2733     }
2734
2735     if (SvUTF8(sv)) {
2736         return SvCUR(sv);
2737     }
2738
2739     if (SvIsCOW(sv)) {
2740         sv_force_normal_flags(sv, 0);
2741     }
2742
2743     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2744         sv_recode_to_utf8(sv, PL_encoding);
2745     else { /* Assume Latin-1/EBCDIC */
2746         /* This function could be much more efficient if we
2747          * had a FLAG in SVs to signal if there are any hibit
2748          * chars in the PV.  Given that there isn't such a flag
2749          * make the loop as fast as possible. */
2750         const U8 * const s = (U8 *) SvPVX_const(sv);
2751         const U8 * const e = (U8 *) SvEND(sv);
2752         const U8 *t = s;
2753         
2754         while (t < e) {
2755             const U8 ch = *t++;
2756             /* Check for hi bit */
2757             if (!NATIVE_IS_INVARIANT(ch)) {
2758                 STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2759                 U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2760
2761                 SvPV_free(sv); /* No longer using what was there before. */
2762                 SvPV_set(sv, (char*)recoded);
2763                 SvCUR_set(sv, len - 1);
2764                 SvLEN_set(sv, len); /* No longer know the real size. */
2765                 break;
2766             }
2767         }
2768         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2769         SvUTF8_on(sv);
2770     }
2771     return SvCUR(sv);
2772 }
2773
2774 /*
2775 =for apidoc sv_utf8_downgrade
2776
2777 Attempts to convert the PV of an SV from characters to bytes.
2778 If the PV contains a character beyond byte, this conversion will fail;
2779 in this case, either returns false or, if C<fail_ok> is not
2780 true, croaks.
2781
2782 This is not as a general purpose Unicode to byte encoding interface:
2783 use the Encode extension for that.
2784
2785 =cut
2786 */
2787
2788 bool
2789 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
2790 {
2791     if (SvPOKp(sv) && SvUTF8(sv)) {
2792         if (SvCUR(sv)) {
2793             U8 *s;
2794             STRLEN len;
2795
2796             if (SvIsCOW(sv)) {
2797                 sv_force_normal_flags(sv, 0);
2798             }
2799             s = (U8 *) SvPV(sv, len);
2800             if (!utf8_to_bytes(s, &len)) {
2801                 if (fail_ok)
2802                     return FALSE;
2803                 else {
2804                     if (PL_op)
2805                         Perl_croak(aTHX_ "Wide character in %s",
2806                                    OP_DESC(PL_op));
2807                     else
2808                         Perl_croak(aTHX_ "Wide character");
2809                 }
2810             }
2811             SvCUR_set(sv, len);
2812         }
2813     }
2814     SvUTF8_off(sv);
2815     return TRUE;
2816 }
2817
2818 /*
2819 =for apidoc sv_utf8_encode
2820
2821 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
2822 flag off so that it looks like octets again.
2823
2824 =cut
2825 */
2826
2827 void
2828 Perl_sv_utf8_encode(pTHX_ register SV *sv)
2829 {
2830     (void) sv_utf8_upgrade(sv);
2831     if (SvIsCOW(sv)) {
2832         sv_force_normal_flags(sv, 0);
2833     }
2834     if (SvREADONLY(sv)) {
2835         Perl_croak(aTHX_ PL_no_modify);
2836     }
2837     SvUTF8_off(sv);
2838 }
2839
2840 /*
2841 =for apidoc sv_utf8_decode
2842
2843 If the PV of the SV is an octet sequence in UTF-8
2844 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
2845 so that it looks like a character. If the PV contains only single-byte
2846 characters, the C<SvUTF8> flag stays being off.
2847 Scans PV for validity and returns false if the PV is invalid UTF-8.
2848
2849 =cut
2850 */
2851
2852 bool
2853 Perl_sv_utf8_decode(pTHX_ register SV *sv)
2854 {
2855     if (SvPOKp(sv)) {
2856         const U8 *c;
2857         const U8 *e;
2858
2859         /* The octets may have got themselves encoded - get them back as
2860          * bytes
2861          */
2862         if (!sv_utf8_downgrade(sv, TRUE))
2863             return FALSE;
2864
2865         /* it is actually just a matter of turning the utf8 flag on, but
2866          * we want to make sure everything inside is valid utf8 first.
2867          */
2868         c = (const U8 *) SvPVX_const(sv);
2869         if (!is_utf8_string(c, SvCUR(sv)+1))
2870             return FALSE;
2871         e = (const U8 *) SvEND(sv);
2872         while (c < e) {
2873             const U8 ch = *c++;
2874             if (!UTF8_IS_INVARIANT(ch)) {
2875                 SvUTF8_on(sv);
2876                 break;
2877             }
2878         }
2879     }
2880     return TRUE;
2881 }
2882
2883 /*
2884 =for apidoc sv_setsv
2885
2886 Copies the contents of the source SV C<ssv> into the destination SV
2887 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2888 function if the source SV needs to be reused. Does not handle 'set' magic.
2889 Loosely speaking, it performs a copy-by-value, obliterating any previous
2890 content of the destination.
2891
2892 You probably want to use one of the assortment of wrappers, such as
2893 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2894 C<SvSetMagicSV_nosteal>.
2895
2896 =for apidoc sv_setsv_flags
2897
2898 Copies the contents of the source SV C<ssv> into the destination SV
2899 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2900 function if the source SV needs to be reused. Does not handle 'set' magic.
2901 Loosely speaking, it performs a copy-by-value, obliterating any previous
2902 content of the destination.
2903 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
2904 C<ssv> if appropriate, else not. If the C<flags> parameter has the
2905 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
2906 and C<sv_setsv_nomg> are implemented in terms of this function.
2907
2908 You probably want to use one of the assortment of wrappers, such as
2909 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2910 C<SvSetMagicSV_nosteal>.
2911
2912 This is the primary function for copying scalars, and most other
2913 copy-ish functions and macros use this underneath.
2914
2915 =cut
2916 */
2917
2918 void
2919 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
2920 {
2921     register U32 sflags;
2922     register int dtype;
2923     register int stype;
2924
2925     if (sstr == dstr)
2926         return;
2927     SV_CHECK_THINKFIRST_COW_DROP(dstr);
2928     if (!sstr)
2929         sstr = &PL_sv_undef;
2930     stype = SvTYPE(sstr);
2931     dtype = SvTYPE(dstr);
2932
2933     SvAMAGIC_off(dstr);
2934     if ( SvVOK(dstr) )
2935     {
2936         /* need to nuke the magic */
2937         mg_free(dstr);
2938         SvRMAGICAL_off(dstr);
2939     }
2940
2941     /* There's a lot of redundancy below but we're going for speed here */
2942
2943     switch (stype) {
2944     case SVt_NULL:
2945       undef_sstr:
2946         if (dtype != SVt_PVGV) {
2947             (void)SvOK_off(dstr);
2948             return;
2949         }
2950         break;
2951     case SVt_IV:
2952         if (SvIOK(sstr)) {
2953             switch (dtype) {
2954             case SVt_NULL:
2955                 sv_upgrade(dstr, SVt_IV);
2956                 break;
2957             case SVt_NV:
2958                 sv_upgrade(dstr, SVt_PVNV);
2959                 break;
2960             case SVt_RV:
2961             case SVt_PV:
2962                 sv_upgrade(dstr, SVt_PVIV);
2963                 break;
2964             }
2965             (void)SvIOK_only(dstr);
2966             SvIV_set(dstr,  SvIVX(sstr));
2967             if (SvIsUV(sstr))
2968                 SvIsUV_on(dstr);
2969             if (SvTAINTED(sstr))
2970                 SvTAINT(dstr);
2971             return;
2972         }
2973         goto undef_sstr;
2974
2975     case SVt_NV:
2976         if (SvNOK(sstr)) {
2977             switch (dtype) {
2978             case SVt_NULL:
2979             case SVt_IV:
2980                 sv_upgrade(dstr, SVt_NV);
2981                 break;
2982             case SVt_RV:
2983             case SVt_PV:
2984             case SVt_PVIV:
2985                 sv_upgrade(dstr, SVt_PVNV);
2986                 break;
2987             }
2988             SvNV_set(dstr, SvNVX(sstr));
2989             (void)SvNOK_only(dstr);
2990             if (SvTAINTED(sstr))
2991                 SvTAINT(dstr);
2992             return;
2993         }
2994         goto undef_sstr;
2995
2996     case SVt_RV:
2997         if (dtype < SVt_RV)
2998             sv_upgrade(dstr, SVt_RV);
2999         else if (dtype == SVt_PVGV &&
3000                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
3001             sstr = SvRV(sstr);
3002             if (sstr == dstr) {
3003                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3004                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3005                 {
3006                     GvIMPORTED_on(dstr);
3007                 }
3008                 GvMULTI_on(dstr);
3009                 return;
3010             }
3011             goto glob_assign;
3012         }
3013         break;
3014     case SVt_PVFM:
3015 #ifdef PERL_OLD_COPY_ON_WRITE
3016         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3017             if (dtype < SVt_PVIV)
3018                 sv_upgrade(dstr, SVt_PVIV);
3019             break;
3020         }
3021         /* Fall through */
3022 #endif
3023     case SVt_PV:
3024         if (dtype < SVt_PV)
3025             sv_upgrade(dstr, SVt_PV);
3026         break;
3027     case SVt_PVIV:
3028         if (dtype < SVt_PVIV)
3029             sv_upgrade(dstr, SVt_PVIV);
3030         break;
3031     case SVt_PVNV:
3032         if (dtype < SVt_PVNV)
3033             sv_upgrade(dstr, SVt_PVNV);
3034         break;
3035     case SVt_PVAV:
3036     case SVt_PVHV:
3037     case SVt_PVCV:
3038     case SVt_PVIO:
3039         {
3040         const char * const type = sv_reftype(sstr,0);
3041         if (PL_op)
3042             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3043         else
3044             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3045         }
3046         break;
3047
3048     case SVt_PVGV:
3049         if (dtype <= SVt_PVGV) {
3050   glob_assign:
3051             if (dtype != SVt_PVGV) {
3052                 const char * const name = GvNAME(sstr);
3053                 const STRLEN len = GvNAMELEN(sstr);
3054                 /* don't upgrade SVt_PVLV: it can hold a glob */
3055                 if (dtype != SVt_PVLV)
3056                     sv_upgrade(dstr, SVt_PVGV);
3057                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3058                 GvSTASH(dstr) = GvSTASH(sstr);
3059                 if (GvSTASH(dstr))
3060                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3061                 GvNAME(dstr) = savepvn(name, len);
3062                 GvNAMELEN(dstr) = len;
3063                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3064             }
3065
3066 #ifdef GV_UNIQUE_CHECK
3067                 if (GvUNIQUE((GV*)dstr)) {
3068                     Perl_croak(aTHX_ PL_no_modify);
3069                 }
3070 #endif
3071
3072             (void)SvOK_off(dstr);
3073             GvINTRO_off(dstr);          /* one-shot flag */
3074             gp_free((GV*)dstr);
3075             GvGP(dstr) = gp_ref(GvGP(sstr));
3076             if (SvTAINTED(sstr))
3077                 SvTAINT(dstr);
3078             if (GvIMPORTED(dstr) != GVf_IMPORTED
3079                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3080             {
3081                 GvIMPORTED_on(dstr);
3082             }
3083             GvMULTI_on(dstr);
3084             return;
3085         }
3086         /* FALL THROUGH */
3087
3088     default:
3089         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3090             mg_get(sstr);
3091             if ((int)SvTYPE(sstr) != stype) {
3092                 stype = SvTYPE(sstr);
3093                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3094                     goto glob_assign;
3095             }
3096         }
3097         if (stype == SVt_PVLV)
3098             SvUPGRADE(dstr, SVt_PVNV);
3099         else
3100             SvUPGRADE(dstr, (U32)stype);
3101     }
3102
3103     sflags = SvFLAGS(sstr);
3104
3105     if (sflags & SVf_ROK) {
3106         if (dtype >= SVt_PV) {
3107             if (dtype == SVt_PVGV) {
3108                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3109                 SV *dref = 0;
3110                 const int intro = GvINTRO(dstr);
3111
3112 #ifdef GV_UNIQUE_CHECK
3113                 if (GvUNIQUE((GV*)dstr)) {
3114                     Perl_croak(aTHX_ PL_no_modify);
3115                 }
3116 #endif
3117
3118                 if (intro) {
3119                     GvINTRO_off(dstr);  /* one-shot flag */
3120                     GvLINE(dstr) = CopLINE(PL_curcop);
3121                     GvEGV(dstr) = (GV*)dstr;
3122                 }
3123                 GvMULTI_on(dstr);
3124                 switch (SvTYPE(sref)) {
3125                 case SVt_PVAV:
3126                     if (intro)
3127                         SAVEGENERICSV(GvAV(dstr));
3128                     else
3129                         dref = (SV*)GvAV(dstr);
3130                     GvAV(dstr) = (AV*)sref;
3131                     if (!GvIMPORTED_AV(dstr)
3132                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3133                     {
3134                         GvIMPORTED_AV_on(dstr);
3135                     }
3136                     break;
3137                 case SVt_PVHV:
3138                     if (intro)
3139                         SAVEGENERICSV(GvHV(dstr));
3140                     else
3141                         dref = (SV*)GvHV(dstr);
3142                     GvHV(dstr) = (HV*)sref;
3143                     if (!GvIMPORTED_HV(dstr)
3144                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3145                     {
3146                         GvIMPORTED_HV_on(dstr);
3147                     }
3148                     break;
3149                 case SVt_PVCV:
3150                     if (intro) {
3151                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3152                             SvREFCNT_dec(GvCV(dstr));
3153                             GvCV(dstr) = Nullcv;
3154                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3155                             PL_sub_generation++;
3156                         }
3157                         SAVEGENERICSV(GvCV(dstr));
3158                     }
3159                     else
3160                         dref = (SV*)GvCV(dstr);
3161                     if (GvCV(dstr) != (CV*)sref) {
3162                         CV* const cv = GvCV(dstr);
3163                         if (cv) {
3164                             if (!GvCVGEN((GV*)dstr) &&
3165                                 (CvROOT(cv) || CvXSUB(cv)))
3166                             {
3167                                 /* Redefining a sub - warning is mandatory if
3168                                    it was a const and its value changed. */
3169                                 if (ckWARN(WARN_REDEFINE)
3170                                     || (CvCONST(cv)
3171                                         && (!CvCONST((CV*)sref)
3172                                             || sv_cmp(cv_const_sv(cv),
3173                                                       cv_const_sv((CV*)sref)))))
3174                                 {
3175                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3176                                         CvCONST(cv)
3177                                         ? "Constant subroutine %s::%s redefined"
3178                                         : "Subroutine %s::%s redefined",
3179                                         HvNAME_get(GvSTASH((GV*)dstr)),
3180                                         GvENAME((GV*)dstr));
3181                                 }
3182                             }
3183                             if (!intro)
3184                                 cv_ckproto(cv, (GV*)dstr,
3185                                            SvPOK(sref)
3186                                            ? SvPVX_const(sref) : Nullch);
3187                         }
3188                         GvCV(dstr) = (CV*)sref;
3189                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3190                         GvASSUMECV_on(dstr);
3191                         PL_sub_generation++;
3192                     }
3193                     if (!GvIMPORTED_CV(dstr)
3194                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3195                     {
3196                         GvIMPORTED_CV_on(dstr);
3197                     }
3198                     break;
3199                 case SVt_PVIO:
3200                     if (intro)
3201                         SAVEGENERICSV(GvIOp(dstr));
3202                     else
3203                         dref = (SV*)GvIOp(dstr);
3204                     GvIOp(dstr) = (IO*)sref;
3205                     break;
3206                 case SVt_PVFM:
3207                     if (intro)
3208                         SAVEGENERICSV(GvFORM(dstr));
3209                     else
3210                         dref = (SV*)GvFORM(dstr);
3211                     GvFORM(dstr) = (CV*)sref;
3212                     break;
3213                 default:
3214                     if (intro)
3215                         SAVEGENERICSV(GvSV(dstr));
3216                     else
3217                         dref = (SV*)GvSV(dstr);
3218                     GvSV(dstr) = sref;
3219                     if (!GvIMPORTED_SV(dstr)
3220                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3221                     {
3222                         GvIMPORTED_SV_on(dstr);
3223                     }
3224                     break;
3225                 }
3226                 if (dref)
3227                     SvREFCNT_dec(dref);
3228                 if (SvTAINTED(sstr))
3229                     SvTAINT(dstr);
3230                 return;
3231             }
3232             if (SvPVX_const(dstr)) {
3233                 SvPV_free(dstr);
3234                 SvLEN_set(dstr, 0);
3235                 SvCUR_set(dstr, 0);
3236             }
3237         }
3238         (void)SvOK_off(dstr);
3239         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3240         SvROK_on(dstr);
3241         if (sflags & SVp_NOK) {
3242             SvNOKp_on(dstr);
3243             /* Only set the public OK flag if the source has public OK.  */
3244             if (sflags & SVf_NOK)
3245                 SvFLAGS(dstr) |= SVf_NOK;
3246             SvNV_set(dstr, SvNVX(sstr));
3247         }
3248         if (sflags & SVp_IOK) {
3249             (void)SvIOKp_on(dstr);
3250             if (sflags & SVf_IOK)
3251                 SvFLAGS(dstr) |= SVf_IOK;
3252             if (sflags & SVf_IVisUV)
3253                 SvIsUV_on(dstr);
3254             SvIV_set(dstr, SvIVX(sstr));
3255         }
3256         if (SvAMAGIC(sstr)) {
3257             SvAMAGIC_on(dstr);
3258         }
3259     }
3260     else if (sflags & SVp_POK) {
3261         bool isSwipe = 0;
3262
3263         /*
3264          * Check to see if we can just swipe the string.  If so, it's a
3265          * possible small lose on short strings, but a big win on long ones.
3266          * It might even be a win on short strings if SvPVX_const(dstr)
3267          * has to be allocated and SvPVX_const(sstr) has to be freed.
3268          */
3269
3270         /* Whichever path we take through the next code, we want this true,
3271            and doing it now facilitates the COW check.  */
3272         (void)SvPOK_only(dstr);
3273
3274         if (
3275             /* We're not already COW  */
3276             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3277 #ifndef PERL_OLD_COPY_ON_WRITE
3278              /* or we are, but dstr isn't a suitable target.  */
3279              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3280 #endif
3281              )
3282             &&
3283             !(isSwipe =
3284                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3285                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3286                  (!(flags & SV_NOSTEAL)) &&
3287                                         /* and we're allowed to steal temps */
3288                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3289                  SvLEN(sstr)    &&        /* and really is a string */
3290                                 /* and won't be needed again, potentially */
3291               !(PL_op && PL_op->op_type == OP_AASSIGN))
3292 #ifdef PERL_OLD_COPY_ON_WRITE
3293             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3294                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3295                  && SvTYPE(sstr) >= SVt_PVIV)
3296 #endif
3297             ) {
3298             /* Failed the swipe test, and it's not a shared hash key either.
3299                Have to copy the string.  */
3300             STRLEN len = SvCUR(sstr);
3301             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3302             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3303             SvCUR_set(dstr, len);
3304             *SvEND(dstr) = '\0';
3305         } else {
3306             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3307                be true in here.  */
3308             /* Either it's a shared hash key, or it's suitable for
3309                copy-on-write or we can swipe the string.  */
3310             if (DEBUG_C_TEST) {
3311                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3312                 sv_dump(sstr);
3313                 sv_dump(dstr);
3314             }
3315 #ifdef PERL_OLD_COPY_ON_WRITE
3316             if (!isSwipe) {
3317                 /* I believe I should acquire a global SV mutex if
3318                    it's a COW sv (not a shared hash key) to stop
3319                    it going un copy-on-write.
3320                    If the source SV has gone un copy on write between up there
3321                    and down here, then (assert() that) it is of the correct
3322                    form to make it copy on write again */
3323                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3324                     != (SVf_FAKE | SVf_READONLY)) {
3325                     SvREADONLY_on(sstr);
3326                     SvFAKE_on(sstr);
3327                     /* Make the source SV into a loop of 1.
3328                        (about to become 2) */
3329                     SV_COW_NEXT_SV_SET(sstr, sstr);
3330                 }
3331             }
3332 #endif
3333             /* Initial code is common.  */
3334             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3335                 SvPV_free(dstr);
3336             }
3337
3338             if (!isSwipe) {
3339                 /* making another shared SV.  */
3340                 STRLEN cur = SvCUR(sstr);
3341                 STRLEN len = SvLEN(sstr);
3342 #ifdef PERL_OLD_COPY_ON_WRITE
3343                 if (len) {
3344                     assert (SvTYPE(dstr) >= SVt_PVIV);
3345                     /* SvIsCOW_normal */
3346                     /* splice us in between source and next-after-source.  */
3347                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3348                     SV_COW_NEXT_SV_SET(sstr, dstr);
3349                     SvPV_set(dstr, SvPVX_mutable(sstr));
3350                 } else
3351 #endif
3352                 {
3353                     /* SvIsCOW_shared_hash */
3354                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3355                                           "Copy on write: Sharing hash\n"));
3356
3357                     assert (SvTYPE(dstr) >= SVt_PV);
3358                     SvPV_set(dstr,
3359                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3360                 }
3361                 SvLEN_set(dstr, len);
3362                 SvCUR_set(dstr, cur);
3363                 SvREADONLY_on(dstr);
3364                 SvFAKE_on(dstr);
3365                 /* Relesase a global SV mutex.  */
3366             }
3367             else
3368                 {       /* Passes the swipe test.  */
3369                 SvPV_set(dstr, SvPVX_mutable(sstr));
3370                 SvLEN_set(dstr, SvLEN(sstr));
3371                 SvCUR_set(dstr, SvCUR(sstr));
3372
3373                 SvTEMP_off(dstr);
3374                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3375                 SvPV_set(sstr, Nullch);
3376                 SvLEN_set(sstr, 0);
3377                 SvCUR_set(sstr, 0);
3378                 SvTEMP_off(sstr);
3379             }
3380         }
3381         if (sflags & SVf_UTF8)
3382             SvUTF8_on(dstr);
3383         if (sflags & SVp_NOK) {
3384             SvNOKp_on(dstr);
3385             if (sflags & SVf_NOK)
3386                 SvFLAGS(dstr) |= SVf_NOK;
3387             SvNV_set(dstr, SvNVX(sstr));
3388         }
3389         if (sflags & SVp_IOK) {
3390             (void)SvIOKp_on(dstr);
3391             if (sflags & SVf_IOK)
3392                 SvFLAGS(dstr) |= SVf_IOK;
3393             if (sflags & SVf_IVisUV)
3394                 SvIsUV_on(dstr);
3395             SvIV_set(dstr, SvIVX(sstr));
3396         }
3397         if (SvVOK(sstr)) {
3398             const MAGIC * const smg = mg_find(sstr,PERL_MAGIC_vstring);
3399             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3400                         smg->mg_ptr, smg->mg_len);
3401             SvRMAGICAL_on(dstr);
3402         }
3403     }
3404     else if (sflags & SVp_IOK) {
3405         if (sflags & SVf_IOK)
3406             (void)SvIOK_only(dstr);
3407         else {
3408             (void)SvOK_off(dstr);
3409             (void)SvIOKp_on(dstr);
3410         }
3411         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3412         if (sflags & SVf_IVisUV)
3413             SvIsUV_on(dstr);
3414         SvIV_set(dstr, SvIVX(sstr));
3415         if (sflags & SVp_NOK) {
3416             if (sflags & SVf_NOK)
3417                 (void)SvNOK_on(dstr);
3418             else
3419                 (void)SvNOKp_on(dstr);
3420             SvNV_set(dstr, SvNVX(sstr));
3421         }
3422     }
3423     else if (sflags & SVp_NOK) {
3424         if (sflags & SVf_NOK)
3425             (void)SvNOK_only(dstr);
3426         else {
3427             (void)SvOK_off(dstr);
3428             SvNOKp_on(dstr);
3429         }
3430         SvNV_set(dstr, SvNVX(sstr));
3431     }
3432     else {
3433         if (dtype == SVt_PVGV) {
3434             if (ckWARN(WARN_MISC))
3435                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3436         }
3437         else
3438             (void)SvOK_off(dstr);
3439     }
3440     if (SvTAINTED(sstr))
3441         SvTAINT(dstr);
3442 }
3443
3444 /*
3445 =for apidoc sv_setsv_mg
3446
3447 Like C<sv_setsv>, but also handles 'set' magic.
3448
3449 =cut
3450 */
3451
3452 void
3453 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3454 {
3455     sv_setsv(dstr,sstr);
3456     SvSETMAGIC(dstr);
3457 }
3458
3459 #ifdef PERL_OLD_COPY_ON_WRITE
3460 SV *
3461 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3462 {
3463     STRLEN cur = SvCUR(sstr);
3464     STRLEN len = SvLEN(sstr);
3465     register char *new_pv;
3466
3467     if (DEBUG_C_TEST) {
3468         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3469                       sstr, dstr);
3470         sv_dump(sstr);
3471         if (dstr)
3472                     sv_dump(dstr);
3473     }
3474
3475     if (dstr) {
3476         if (SvTHINKFIRST(dstr))
3477             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3478         else if (SvPVX_const(dstr))
3479             Safefree(SvPVX_const(dstr));
3480     }
3481     else
3482         new_SV(dstr);
3483     SvUPGRADE(dstr, SVt_PVIV);
3484
3485     assert (SvPOK(sstr));
3486     assert (SvPOKp(sstr));
3487     assert (!SvIOK(sstr));
3488     assert (!SvIOKp(sstr));
3489     assert (!SvNOK(sstr));
3490     assert (!SvNOKp(sstr));
3491
3492     if (SvIsCOW(sstr)) {
3493
3494         if (SvLEN(sstr) == 0) {
3495             /* source is a COW shared hash key.  */
3496             DEBUG_C(PerlIO_printf(Perl_debug_log,
3497                                   "Fast copy on write: Sharing hash\n"));
3498             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3499             goto common_exit;
3500         }
3501         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3502     } else {
3503         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3504         SvUPGRADE(sstr, SVt_PVIV);
3505         SvREADONLY_on(sstr);
3506         SvFAKE_on(sstr);
3507         DEBUG_C(PerlIO_printf(Perl_debug_log,
3508                               "Fast copy on write: Converting sstr to COW\n"));
3509         SV_COW_NEXT_SV_SET(dstr, sstr);
3510     }
3511     SV_COW_NEXT_SV_SET(sstr, dstr);
3512     new_pv = SvPVX_mutable(sstr);
3513
3514   common_exit:
3515     SvPV_set(dstr, new_pv);
3516     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3517     if (SvUTF8(sstr))
3518         SvUTF8_on(dstr);
3519     SvLEN_set(dstr, len);
3520     SvCUR_set(dstr, cur);
3521     if (DEBUG_C_TEST) {
3522         sv_dump(dstr);
3523     }
3524     return dstr;
3525 }
3526 #endif
3527
3528 /*
3529 =for apidoc sv_setpvn
3530
3531 Copies a string into an SV.  The C<len> parameter indicates the number of
3532 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3533 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3534
3535 =cut
3536 */
3537
3538 void
3539 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3540 {
3541     register char *dptr;
3542
3543     SV_CHECK_THINKFIRST_COW_DROP(sv);
3544     if (!ptr) {
3545         (void)SvOK_off(sv);
3546         return;
3547     }
3548     else {
3549         /* len is STRLEN which is unsigned, need to copy to signed */
3550         const IV iv = len;
3551         if (iv < 0)
3552             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3553     }
3554     SvUPGRADE(sv, SVt_PV);
3555
3556     dptr = SvGROW(sv, len + 1);
3557     Move(ptr,dptr,len,char);
3558     dptr[len] = '\0';
3559     SvCUR_set(sv, len);
3560     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3561     SvTAINT(sv);
3562 }
3563
3564 /*
3565 =for apidoc sv_setpvn_mg
3566
3567 Like C<sv_setpvn>, but also handles 'set' magic.
3568
3569 =cut
3570 */
3571
3572 void
3573 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3574 {
3575     sv_setpvn(sv,ptr,len);
3576     SvSETMAGIC(sv);
3577 }
3578
3579 /*
3580 =for apidoc sv_setpv
3581
3582 Copies a string into an SV.  The string must be null-terminated.  Does not
3583 handle 'set' magic.  See C<sv_setpv_mg>.
3584
3585 =cut
3586 */
3587
3588 void
3589 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3590 {
3591     register STRLEN len;
3592
3593     SV_CHECK_THINKFIRST_COW_DROP(sv);
3594     if (!ptr) {
3595         (void)SvOK_off(sv);
3596         return;
3597     }
3598     len = strlen(ptr);
3599     SvUPGRADE(sv, SVt_PV);
3600
3601     SvGROW(sv, len + 1);
3602     Move(ptr,SvPVX(sv),len+1,char);
3603     SvCUR_set(sv, len);
3604     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3605     SvTAINT(sv);
3606 }
3607
3608 /*
3609 =for apidoc sv_setpv_mg
3610
3611 Like C<sv_setpv>, but also handles 'set' magic.
3612
3613 =cut
3614 */
3615
3616 void
3617 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3618 {
3619     sv_setpv(sv,ptr);
3620     SvSETMAGIC(sv);
3621 }
3622
3623 /*
3624 =for apidoc sv_usepvn
3625
3626 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3627 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3628 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3629 string length, C<len>, must be supplied.  This function will realloc the
3630 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3631 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3632 See C<sv_usepvn_mg>.
3633
3634 =cut
3635 */
3636
3637 void
3638 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3639 {
3640     STRLEN allocate;
3641     SV_CHECK_THINKFIRST_COW_DROP(sv);
3642     SvUPGRADE(sv, SVt_PV);
3643     if (!ptr) {
3644         (void)SvOK_off(sv);
3645         return;
3646     }
3647     if (SvPVX_const(sv))
3648         SvPV_free(sv);
3649
3650     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3651     ptr = saferealloc (ptr, allocate);
3652     SvPV_set(sv, ptr);
3653     SvCUR_set(sv, len);
3654     SvLEN_set(sv, allocate);
3655     *SvEND(sv) = '\0';
3656     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3657     SvTAINT(sv);
3658 }
3659
3660 /*
3661 =for apidoc sv_usepvn_mg
3662
3663 Like C<sv_usepvn>, but also handles 'set' magic.
3664
3665 =cut
3666 */
3667
3668 void
3669 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3670 {
3671     sv_usepvn(sv,ptr,len);
3672     SvSETMAGIC(sv);
3673 }
3674
3675 #ifdef PERL_OLD_COPY_ON_WRITE
3676 /* Need to do this *after* making the SV normal, as we need the buffer
3677    pointer to remain valid until after we've copied it.  If we let go too early,
3678    another thread could invalidate it by unsharing last of the same hash key
3679    (which it can do by means other than releasing copy-on-write Svs)
3680    or by changing the other copy-on-write SVs in the loop.  */
3681 STATIC void
3682 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3683 {
3684     if (len) { /* this SV was SvIsCOW_normal(sv) */
3685          /* we need to find the SV pointing to us.  */
3686         SV * const current = SV_COW_NEXT_SV(after);
3687
3688         if (current == sv) {
3689             /* The SV we point to points back to us (there were only two of us
3690                in the loop.)
3691                Hence other SV is no longer copy on write either.  */
3692             SvFAKE_off(after);
3693             SvREADONLY_off(after);
3694         } else {
3695             /* We need to follow the pointers around the loop.  */
3696             SV *next;
3697             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3698                 assert (next);
3699                 current = next;
3700                  /* don't loop forever if the structure is bust, and we have
3701                     a pointer into a closed loop.  */
3702                 assert (current != after);
3703                 assert (SvPVX_const(current) == pvx);
3704             }
3705             /* Make the SV before us point to the SV after us.  */
3706             SV_COW_NEXT_SV_SET(current, after);
3707         }
3708     } else {
3709         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3710     }
3711 }
3712
3713 int
3714 Perl_sv_release_IVX(pTHX_ register SV *sv)
3715 {
3716     if (SvIsCOW(sv))
3717         sv_force_normal_flags(sv, 0);
3718     SvOOK_off(sv);
3719     return 0;
3720 }
3721 #endif
3722 /*
3723 =for apidoc sv_force_normal_flags
3724
3725 Undo various types of fakery on an SV: if the PV is a shared string, make
3726 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3727 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3728 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3729 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3730 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3731 set to some other value.) In addition, the C<flags> parameter gets passed to
3732 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3733 with flags set to 0.
3734
3735 =cut
3736 */
3737
3738 void
3739 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3740 {
3741 #ifdef PERL_OLD_COPY_ON_WRITE
3742     if (SvREADONLY(sv)) {
3743         /* At this point I believe I should acquire a global SV mutex.  */
3744         if (SvFAKE(sv)) {
3745             const char * const pvx = SvPVX_const(sv);
3746             const STRLEN len = SvLEN(sv);
3747             const STRLEN cur = SvCUR(sv);
3748             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3749             if (DEBUG_C_TEST) {
3750                 PerlIO_printf(Perl_debug_log,
3751                               "Copy on write: Force normal %ld\n",
3752                               (long) flags);
3753                 sv_dump(sv);
3754             }
3755             SvFAKE_off(sv);
3756             SvREADONLY_off(sv);
3757             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3758             SvPV_set(sv, (char*)0);
3759             SvLEN_set(sv, 0);
3760             if (flags & SV_COW_DROP_PV) {
3761                 /* OK, so we don't need to copy our buffer.  */
3762                 SvPOK_off(sv);
3763             } else {
3764                 SvGROW(sv, cur + 1);
3765                 Move(pvx,SvPVX(sv),cur,char);
3766                 SvCUR_set(sv, cur);
3767                 *SvEND(sv) = '\0';
3768             }
3769             sv_release_COW(sv, pvx, len, next);
3770             if (DEBUG_C_TEST) {
3771                 sv_dump(sv);
3772             }
3773         }
3774         else if (IN_PERL_RUNTIME)
3775             Perl_croak(aTHX_ PL_no_modify);
3776         /* At this point I believe that I can drop the global SV mutex.  */
3777     }
3778 #else
3779     if (SvREADONLY(sv)) {
3780         if (SvFAKE(sv)) {
3781             const char * const pvx = SvPVX_const(sv);
3782             const STRLEN len = SvCUR(sv);
3783             SvFAKE_off(sv);
3784             SvREADONLY_off(sv);
3785             SvPV_set(sv, Nullch);
3786             SvLEN_set(sv, 0);
3787             SvGROW(sv, len + 1);
3788             Move(pvx,SvPVX(sv),len,char);
3789             *SvEND(sv) = '\0';
3790             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3791         }
3792         else if (IN_PERL_RUNTIME)
3793             Perl_croak(aTHX_ PL_no_modify);
3794     }
3795 #endif
3796     if (SvROK(sv))
3797         sv_unref_flags(sv, flags);
3798     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
3799         sv_unglob(sv);
3800 }
3801
3802 /*
3803 =for apidoc sv_chop
3804
3805 Efficient removal of characters from the beginning of the string buffer.
3806 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
3807 the string buffer.  The C<ptr> becomes the first character of the adjusted
3808 string. Uses the "OOK hack".
3809 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
3810 refer to the same chunk of data.
3811
3812 =cut
3813 */
3814
3815 void
3816 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
3817 {
3818     register STRLEN delta;
3819     if (!ptr || !SvPOKp(sv))
3820         return;
3821     delta = ptr - SvPVX_const(sv);
3822     SV_CHECK_THINKFIRST(sv);
3823     if (SvTYPE(sv) < SVt_PVIV)
3824         sv_upgrade(sv,SVt_PVIV);
3825
3826     if (!SvOOK(sv)) {
3827         if (!SvLEN(sv)) { /* make copy of shared string */
3828             const char *pvx = SvPVX_const(sv);
3829             const STRLEN len = SvCUR(sv);
3830             SvGROW(sv, len + 1);
3831             Move(pvx,SvPVX(sv),len,char);
3832             *SvEND(sv) = '\0';
3833         }
3834         SvIV_set(sv, 0);
3835         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
3836            and we do that anyway inside the SvNIOK_off
3837         */
3838         SvFLAGS(sv) |= SVf_OOK;
3839     }
3840     SvNIOK_off(sv);
3841     SvLEN_set(sv, SvLEN(sv) - delta);
3842     SvCUR_set(sv, SvCUR(sv) - delta);
3843     SvPV_set(sv, SvPVX(sv) + delta);
3844     SvIV_set(sv, SvIVX(sv) + delta);
3845 }
3846
3847 /*
3848 =for apidoc sv_catpvn
3849
3850 Concatenates the string onto the end of the string which is in the SV.  The
3851 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3852 status set, then the bytes appended should be valid UTF-8.
3853 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
3854
3855 =for apidoc sv_catpvn_flags
3856
3857 Concatenates the string onto the end of the string which is in the SV.  The
3858 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3859 status set, then the bytes appended should be valid UTF-8.
3860 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
3861 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
3862 in terms of this function.
3863
3864 =cut
3865 */
3866
3867 void
3868 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
3869 {
3870     STRLEN dlen;
3871     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
3872
3873     SvGROW(dsv, dlen + slen + 1);
3874     if (sstr == dstr)
3875         sstr = SvPVX_const(dsv);
3876     Move(sstr, SvPVX(dsv) + dlen, slen, char);
3877     SvCUR_set(dsv, SvCUR(dsv) + slen);
3878     *SvEND(dsv) = '\0';
3879     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
3880     SvTAINT(dsv);
3881     if (flags & SV_SMAGIC)
3882         SvSETMAGIC(dsv);
3883 }
3884
3885 /*
3886 =for apidoc sv_catsv
3887
3888 Concatenates the string from SV C<ssv> onto the end of the string in
3889 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
3890 not 'set' magic.  See C<sv_catsv_mg>.
3891
3892 =for apidoc sv_catsv_flags
3893
3894 Concatenates the string from SV C<ssv> onto the end of the string in
3895 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
3896 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
3897 and C<sv_catsv_nomg> are implemented in terms of this function.
3898
3899 =cut */
3900
3901 void
3902 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
3903 {
3904     if (ssv) {
3905         STRLEN slen;
3906         const char *spv = SvPV_const(ssv, slen);
3907         if (spv) {
3908             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
3909                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
3910                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
3911                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
3912                 dsv->sv_flags doesn't have that bit set.
3913                 Andy Dougherty  12 Oct 2001
3914             */
3915             const I32 sutf8 = DO_UTF8(ssv);
3916             I32 dutf8;
3917
3918             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
3919                 mg_get(dsv);
3920             dutf8 = DO_UTF8(dsv);
3921
3922             if (dutf8 != sutf8) {
3923                 if (dutf8) {
3924                     /* Not modifying source SV, so taking a temporary copy. */
3925                     SV* const csv = sv_2mortal(newSVpvn(spv, slen));
3926
3927                     sv_utf8_upgrade(csv);
3928                     spv = SvPV_const(csv, slen);
3929                 }
3930                 else
3931                     sv_utf8_upgrade_nomg(dsv);
3932             }
3933             sv_catpvn_nomg(dsv, spv, slen);
3934         }
3935     }
3936     if (flags & SV_SMAGIC)
3937         SvSETMAGIC(dsv);
3938 }
3939
3940 /*
3941 =for apidoc sv_catpv
3942
3943 Concatenates the string onto the end of the string which is in the SV.
3944 If the SV has the UTF-8 status set, then the bytes appended should be
3945 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
3946
3947 =cut */
3948
3949 void
3950 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
3951 {
3952     register STRLEN len;
3953     STRLEN tlen;
3954     char *junk;
3955
3956     if (!ptr)
3957         return;
3958     junk = SvPV_force(sv, tlen);
3959     len = strlen(ptr);
3960     SvGROW(sv, tlen + len + 1);
3961     if (ptr == junk)
3962         ptr = SvPVX_const(sv);
3963     Move(ptr,SvPVX(sv)+tlen,len+1,char);
3964     SvCUR_set(sv, SvCUR(sv) + len);
3965     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3966     SvTAINT(sv);
3967 }
3968
3969 /*
3970 =for apidoc sv_catpv_mg
3971
3972 Like C<sv_catpv>, but also handles 'set' magic.
3973
3974 =cut
3975 */
3976
3977 void
3978 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
3979 {
3980     sv_catpv(sv,ptr);
3981     SvSETMAGIC(sv);
3982 }
3983
3984 /*
3985 =for apidoc newSV
3986
3987 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
3988 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
3989 macro.
3990
3991 =cut
3992 */
3993
3994 SV *
3995 Perl_newSV(pTHX_ STRLEN len)
3996 {
3997     register SV *sv;
3998
3999     new_SV(sv);
4000     if (len) {
4001         sv_upgrade(sv, SVt_PV);
4002         SvGROW(sv, len + 1);
4003     }
4004     return sv;
4005 }
4006 /*
4007 =for apidoc sv_magicext
4008
4009 Adds magic to an SV, upgrading it if necessary. Applies the
4010 supplied vtable and returns a pointer to the magic added.
4011
4012 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4013 In particular, you can add magic to SvREADONLY SVs, and add more than
4014 one instance of the same 'how'.
4015
4016 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4017 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4018 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4019 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4020
4021 (This is now used as a subroutine by C<sv_magic>.)
4022
4023 =cut
4024 */
4025 MAGIC * 
4026 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4027                  const char* name, I32 namlen)
4028 {
4029     MAGIC* mg;
4030
4031     if (SvTYPE(sv) < SVt_PVMG) {
4032         SvUPGRADE(sv, SVt_PVMG);
4033     }
4034     Newxz(mg, 1, MAGIC);
4035     mg->mg_moremagic = SvMAGIC(sv);
4036     SvMAGIC_set(sv, mg);
4037
4038     /* Sometimes a magic contains a reference loop, where the sv and
4039        object refer to each other.  To prevent a reference loop that
4040        would prevent such objects being freed, we look for such loops
4041        and if we find one we avoid incrementing the object refcount.
4042
4043        Note we cannot do this to avoid self-tie loops as intervening RV must
4044        have its REFCNT incremented to keep it in existence.
4045
4046     */
4047     if (!obj || obj == sv ||
4048         how == PERL_MAGIC_arylen ||
4049         how == PERL_MAGIC_qr ||
4050         how == PERL_MAGIC_symtab ||
4051         (SvTYPE(obj) == SVt_PVGV &&
4052             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4053             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4054             GvFORM(obj) == (CV*)sv)))
4055     {
4056         mg->mg_obj = obj;
4057     }
4058     else {
4059         mg->mg_obj = SvREFCNT_inc(obj);
4060         mg->mg_flags |= MGf_REFCOUNTED;
4061     }
4062
4063     /* Normal self-ties simply pass a null object, and instead of
4064        using mg_obj directly, use the SvTIED_obj macro to produce a
4065        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4066        with an RV obj pointing to the glob containing the PVIO.  In
4067        this case, to avoid a reference loop, we need to weaken the
4068        reference.
4069     */
4070
4071     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4072         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4073     {
4074       sv_rvweaken(obj);
4075     }
4076
4077     mg->mg_type = how;
4078     mg->mg_len = namlen;
4079     if (name) {
4080         if (namlen > 0)
4081             mg->mg_ptr = savepvn(name, namlen);
4082         else if (namlen == HEf_SVKEY)
4083             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4084         else
4085             mg->mg_ptr = (char *) name;
4086     }
4087     mg->mg_virtual = vtable;
4088
4089     mg_magical(sv);
4090     if (SvGMAGICAL(sv))
4091         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4092     return mg;
4093 }
4094
4095 /*
4096 =for apidoc sv_magic
4097
4098 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4099 then adds a new magic item of type C<how> to the head of the magic list.
4100
4101 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4102 handling of the C<name> and C<namlen> arguments.
4103
4104 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4105 to add more than one instance of the same 'how'.
4106
4107 =cut
4108 */
4109
4110 void
4111 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4112 {
4113     const MGVTBL *vtable;
4114     MAGIC* mg;
4115
4116 #ifdef PERL_OLD_COPY_ON_WRITE
4117     if (SvIsCOW(sv))
4118         sv_force_normal_flags(sv, 0);
4119 #endif
4120     if (SvREADONLY(sv)) {
4121         if (
4122             /* its okay to attach magic to shared strings; the subsequent
4123              * upgrade to PVMG will unshare the string */
4124             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4125
4126             && IN_PERL_RUNTIME
4127             && how != PERL_MAGIC_regex_global
4128             && how != PERL_MAGIC_bm
4129             && how != PERL_MAGIC_fm
4130             && how != PERL_MAGIC_sv
4131             && how != PERL_MAGIC_backref
4132            )
4133         {
4134             Perl_croak(aTHX_ PL_no_modify);
4135         }
4136     }
4137     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4138         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4139             /* sv_magic() refuses to add a magic of the same 'how' as an
4140                existing one
4141              */
4142             if (how == PERL_MAGIC_taint)
4143                 mg->mg_len |= 1;
4144             return;
4145         }
4146     }
4147
4148     switch (how) {
4149     case PERL_MAGIC_sv:
4150         vtable = &PL_vtbl_sv;
4151         break;
4152     case PERL_MAGIC_overload:
4153         vtable = &PL_vtbl_amagic;
4154         break;
4155     case PERL_MAGIC_overload_elem:
4156         vtable = &PL_vtbl_amagicelem;
4157         break;
4158     case PERL_MAGIC_overload_table:
4159         vtable = &PL_vtbl_ovrld;
4160         break;
4161     case PERL_MAGIC_bm:
4162         vtable = &PL_vtbl_bm;
4163         break;
4164     case PERL_MAGIC_regdata:
4165         vtable = &PL_vtbl_regdata;
4166         break;
4167     case PERL_MAGIC_regdatum:
4168         vtable = &PL_vtbl_regdatum;
4169         break;
4170     case PERL_MAGIC_env:
4171         vtable = &PL_vtbl_env;
4172         break;
4173     case PERL_MAGIC_fm:
4174         vtable = &PL_vtbl_fm;
4175         break;
4176     case PERL_MAGIC_envelem:
4177         vtable = &PL_vtbl_envelem;
4178         break;
4179     case PERL_MAGIC_regex_global:
4180         vtable = &PL_vtbl_mglob;
4181         break;
4182     case PERL_MAGIC_isa:
4183         vtable = &PL_vtbl_isa;
4184         break;
4185     case PERL_MAGIC_isaelem:
4186         vtable = &PL_vtbl_isaelem;
4187         break;
4188     case PERL_MAGIC_nkeys:
4189         vtable = &PL_vtbl_nkeys;
4190         break;
4191     case PERL_MAGIC_dbfile:
4192         vtable = NULL;
4193         break;
4194     case PERL_MAGIC_dbline:
4195         vtable = &PL_vtbl_dbline;
4196         break;
4197 #ifdef USE_LOCALE_COLLATE
4198     case PERL_MAGIC_collxfrm:
4199         vtable = &PL_vtbl_collxfrm;
4200         break;
4201 #endif /* USE_LOCALE_COLLATE */
4202     case PERL_MAGIC_tied:
4203         vtable = &PL_vtbl_pack;
4204         break;
4205     case PERL_MAGIC_tiedelem:
4206     case PERL_MAGIC_tiedscalar:
4207         vtable = &PL_vtbl_packelem;
4208         break;
4209     case PERL_MAGIC_qr:
4210         vtable = &PL_vtbl_regexp;
4211         break;
4212     case PERL_MAGIC_sig:
4213         vtable = &PL_vtbl_sig;
4214         break;
4215     case PERL_MAGIC_sigelem:
4216         vtable = &PL_vtbl_sigelem;
4217         break;
4218     case PERL_MAGIC_taint:
4219         vtable = &PL_vtbl_taint;
4220         break;
4221     case PERL_MAGIC_uvar:
4222         vtable = &PL_vtbl_uvar;
4223         break;
4224     case PERL_MAGIC_vec:
4225         vtable = &PL_vtbl_vec;
4226         break;
4227     case PERL_MAGIC_arylen_p:
4228     case PERL_MAGIC_rhash:
4229     case PERL_MAGIC_symtab:
4230     case PERL_MAGIC_vstring:
4231         vtable = NULL;
4232         break;
4233     case PERL_MAGIC_utf8:
4234         vtable = &PL_vtbl_utf8;
4235         break;
4236     case PERL_MAGIC_substr:
4237         vtable = &PL_vtbl_substr;
4238         break;
4239     case PERL_MAGIC_defelem:
4240         vtable = &PL_vtbl_defelem;
4241         break;
4242     case PERL_MAGIC_glob:
4243         vtable = &PL_vtbl_glob;
4244         break;
4245     case PERL_MAGIC_arylen:
4246         vtable = &PL_vtbl_arylen;
4247         break;
4248     case PERL_MAGIC_pos:
4249         vtable = &PL_vtbl_pos;
4250         break;
4251     case PERL_MAGIC_backref:
4252         vtable = &PL_vtbl_backref;
4253         break;
4254     case PERL_MAGIC_ext:
4255         /* Reserved for use by extensions not perl internals.           */
4256         /* Useful for attaching extension internal data to perl vars.   */
4257         /* Note that multiple extensions may clash if magical scalars   */
4258         /* etc holding private data from one are passed to another.     */
4259         vtable = NULL;
4260         break;
4261     default:
4262         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4263     }
4264
4265     /* Rest of work is done else where */
4266     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4267
4268     switch (how) {
4269     case PERL_MAGIC_taint:
4270         mg->mg_len = 1;
4271         break;
4272     case PERL_MAGIC_ext:
4273     case PERL_MAGIC_dbfile:
4274         SvRMAGICAL_on(sv);
4275         break;
4276     }
4277 }
4278
4279 /*
4280 =for apidoc sv_unmagic
4281
4282 Removes all magic of type C<type> from an SV.
4283
4284 =cut
4285 */
4286
4287 int
4288 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4289 {
4290     MAGIC* mg;
4291     MAGIC** mgp;
4292     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4293         return 0;
4294     mgp = &SvMAGIC(sv);
4295     for (mg = *mgp; mg; mg = *mgp) {
4296         if (mg->mg_type == type) {
4297             const MGVTBL* const vtbl = mg->mg_virtual;
4298             *mgp = mg->mg_moremagic;
4299             if (vtbl && vtbl->svt_free)
4300                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4301             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4302                 if (mg->mg_len > 0)
4303                     Safefree(mg->mg_ptr);
4304                 else if (mg->mg_len == HEf_SVKEY)
4305                     SvREFCNT_dec((SV*)mg->mg_ptr);
4306                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4307                     Safefree(mg->mg_ptr);
4308             }
4309             if (mg->mg_flags & MGf_REFCOUNTED)
4310                 SvREFCNT_dec(mg->mg_obj);
4311             Safefree(mg);
4312         }
4313         else
4314             mgp = &mg->mg_moremagic;
4315     }
4316     if (!SvMAGIC(sv)) {
4317         SvMAGICAL_off(sv);
4318        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4319     }
4320
4321     return 0;
4322 }
4323
4324 /*
4325 =for apidoc sv_rvweaken
4326
4327 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4328 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4329 push a back-reference to this RV onto the array of backreferences
4330 associated with that magic.
4331
4332 =cut
4333 */
4334
4335 SV *
4336 Perl_sv_rvweaken(pTHX_ SV *sv)
4337 {
4338     SV *tsv;
4339     if (!SvOK(sv))  /* let undefs pass */
4340         return sv;
4341     if (!SvROK(sv))
4342         Perl_croak(aTHX_ "Can't weaken a nonreference");
4343     else if (SvWEAKREF(sv)) {
4344         if (ckWARN(WARN_MISC))
4345             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4346         return sv;
4347     }
4348     tsv = SvRV(sv);
4349     Perl_sv_add_backref(aTHX_ tsv, sv);
4350     SvWEAKREF_on(sv);
4351     SvREFCNT_dec(tsv);
4352     return sv;
4353 }
4354
4355 /* Give tsv backref magic if it hasn't already got it, then push a
4356  * back-reference to sv onto the array associated with the backref magic.
4357  */
4358
4359 void
4360 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4361 {
4362     AV *av;
4363     MAGIC *mg;
4364     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4365         av = (AV*)mg->mg_obj;
4366     else {
4367         av = newAV();
4368         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4369         /* av now has a refcnt of 2, which avoids it getting freed
4370          * before us during global cleanup. The extra ref is removed
4371          * by magic_killbackrefs() when tsv is being freed */
4372     }
4373     if (AvFILLp(av) >= AvMAX(av)) {
4374         av_extend(av, AvFILLp(av)+1);
4375     }
4376     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4377 }
4378
4379 /* delete a back-reference to ourselves from the backref magic associated
4380  * with the SV we point to.
4381  */
4382
4383 STATIC void
4384 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4385 {
4386     AV *av;
4387     SV **svp;
4388     I32 i;
4389     MAGIC *mg = NULL;
4390     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4391         if (PL_in_clean_all)
4392             return;
4393     }
4394     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4395         Perl_croak(aTHX_ "panic: del_backref");
4396     av = (AV *)mg->mg_obj;
4397     svp = AvARRAY(av);
4398     /* We shouldn't be in here more than once, but for paranoia reasons lets
4399        not assume this.  */
4400     for (i = AvFILLp(av); i >= 0; i--) {
4401         if (svp[i] == sv) {
4402             const SSize_t fill = AvFILLp(av);
4403             if (i != fill) {
4404                 /* We weren't the last entry.
4405                    An unordered list has this property that you can take the
4406                    last element off the end to fill the hole, and it's still
4407                    an unordered list :-)
4408                 */
4409                 svp[i] = svp[fill];
4410             }
4411             svp[fill] = Nullsv;
4412             AvFILLp(av) = fill - 1;
4413         }
4414     }
4415 }
4416
4417 /*
4418 =for apidoc sv_insert
4419
4420 Inserts a string at the specified offset/length within the SV. Similar to
4421 the Perl substr() function.
4422
4423 =cut
4424 */
4425
4426 void
4427 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4428 {
4429     register char *big;
4430     register char *mid;
4431     register char *midend;
4432     register char *bigend;
4433     register I32 i;
4434     STRLEN curlen;
4435
4436
4437     if (!bigstr)
4438         Perl_croak(aTHX_ "Can't modify non-existent substring");
4439     SvPV_force(bigstr, curlen);
4440     (void)SvPOK_only_UTF8(bigstr);
4441     if (offset + len > curlen) {
4442         SvGROW(bigstr, offset+len+1);
4443         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4444         SvCUR_set(bigstr, offset+len);
4445     }
4446
4447     SvTAINT(bigstr);
4448     i = littlelen - len;
4449     if (i > 0) {                        /* string might grow */
4450         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4451         mid = big + offset + len;
4452         midend = bigend = big + SvCUR(bigstr);
4453         bigend += i;
4454         *bigend = '\0';
4455         while (midend > mid)            /* shove everything down */
4456             *--bigend = *--midend;
4457         Move(little,big+offset,littlelen,char);
4458         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4459         SvSETMAGIC(bigstr);
4460         return;
4461     }
4462     else if (i == 0) {
4463         Move(little,SvPVX(bigstr)+offset,len,char);
4464         SvSETMAGIC(bigstr);
4465         return;
4466     }
4467
4468     big = SvPVX(bigstr);
4469     mid = big + offset;
4470     midend = mid + len;
4471     bigend = big + SvCUR(bigstr);
4472
4473     if (midend > bigend)
4474         Perl_croak(aTHX_ "panic: sv_insert");
4475
4476     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4477         if (littlelen) {
4478             Move(little, mid, littlelen,char);
4479             mid += littlelen;
4480         }
4481         i = bigend - midend;
4482         if (i > 0) {
4483             Move(midend, mid, i,char);
4484             mid += i;
4485         }
4486         *mid = '\0';
4487         SvCUR_set(bigstr, mid - big);
4488     }
4489     else if ((i = mid - big)) { /* faster from front */
4490         midend -= littlelen;
4491         mid = midend;
4492         sv_chop(bigstr,midend-i);
4493         big += i;
4494         while (i--)
4495             *--midend = *--big;
4496         if (littlelen)
4497             Move(little, mid, littlelen,char);
4498     }
4499     else if (littlelen) {
4500         midend -= littlelen;
4501         sv_chop(bigstr,midend);
4502         Move(little,midend,littlelen,char);
4503     }
4504     else {
4505         sv_chop(bigstr,midend);
4506     }
4507     SvSETMAGIC(bigstr);
4508 }
4509
4510 /*
4511 =for apidoc sv_replace
4512
4513 Make the first argument a copy of the second, then delete the original.
4514 The target SV physically takes over ownership of the body of the source SV
4515 and inherits its flags; however, the target keeps any magic it owns,
4516 and any magic in the source is discarded.
4517 Note that this is a rather specialist SV copying operation; most of the
4518 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4519
4520 =cut
4521 */
4522
4523 void
4524 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4525 {
4526     const U32 refcnt = SvREFCNT(sv);
4527     SV_CHECK_THINKFIRST_COW_DROP(sv);
4528     if (SvREFCNT(nsv) != 1) {
4529         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4530                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4531     }
4532     if (SvMAGICAL(sv)) {
4533         if (SvMAGICAL(nsv))
4534             mg_free(nsv);
4535         else
4536             sv_upgrade(nsv, SVt_PVMG);
4537         SvMAGIC_set(nsv, SvMAGIC(sv));
4538         SvFLAGS(nsv) |= SvMAGICAL(sv);
4539         SvMAGICAL_off(sv);
4540         SvMAGIC_set(sv, NULL);
4541     }
4542     SvREFCNT(sv) = 0;
4543     sv_clear(sv);
4544     assert(!SvREFCNT(sv));
4545 #ifdef DEBUG_LEAKING_SCALARS
4546     sv->sv_flags  = nsv->sv_flags;
4547     sv->sv_any    = nsv->sv_any;
4548     sv->sv_refcnt = nsv->sv_refcnt;
4549     sv->sv_u      = nsv->sv_u;
4550 #else
4551     StructCopy(nsv,sv,SV);
4552 #endif
4553     /* Currently could join these into one piece of pointer arithmetic, but
4554        it would be unclear.  */
4555     if(SvTYPE(sv) == SVt_IV)
4556         SvANY(sv)
4557             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4558     else if (SvTYPE(sv) == SVt_RV) {
4559         SvANY(sv) = &sv->sv_u.svu_rv;
4560     }
4561         
4562
4563 #ifdef PERL_OLD_COPY_ON_WRITE
4564     if (SvIsCOW_normal(nsv)) {
4565         /* We need to follow the pointers around the loop to make the
4566            previous SV point to sv, rather than nsv.  */
4567         SV *next;
4568         SV *current = nsv;
4569         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4570             assert(next);
4571             current = next;
4572             assert(SvPVX_const(current) == SvPVX_const(nsv));
4573         }
4574         /* Make the SV before us point to the SV after us.  */
4575         if (DEBUG_C_TEST) {
4576             PerlIO_printf(Perl_debug_log, "previous is\n");
4577             sv_dump(current);
4578             PerlIO_printf(Perl_debug_log,
4579                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4580                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4581         }
4582         SV_COW_NEXT_SV_SET(current, sv);
4583     }
4584 #endif
4585     SvREFCNT(sv) = refcnt;
4586     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4587     SvREFCNT(nsv) = 0;
4588     del_SV(nsv);
4589 }
4590
4591 /*
4592 =for apidoc sv_clear
4593
4594 Clear an SV: call any destructors, free up any memory used by the body,
4595 and free the body itself. The SV's head is I<not> freed, although
4596 its type is set to all 1's so that it won't inadvertently be assumed
4597 to be live during global destruction etc.
4598 This function should only be called when REFCNT is zero. Most of the time
4599 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4600 instead.
4601
4602 =cut
4603 */
4604
4605 void
4606 Perl_sv_clear(pTHX_ register SV *sv)
4607 {
4608     dVAR;
4609     const U32 type = SvTYPE(sv);
4610     const struct body_details *const sv_type_details
4611         = bodies_by_type + type;
4612
4613     assert(sv);
4614     assert(SvREFCNT(sv) == 0);
4615
4616     if (type <= SVt_IV)
4617         return;
4618
4619     if (SvOBJECT(sv)) {
4620         if (PL_defstash) {              /* Still have a symbol table? */
4621             dSP;
4622             HV* stash;
4623             do {        
4624                 CV* destructor;
4625                 stash = SvSTASH(sv);
4626                 destructor = StashHANDLER(stash,DESTROY);
4627                 if (destructor) {
4628                     SV* const tmpref = newRV(sv);
4629                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4630                     ENTER;
4631                     PUSHSTACKi(PERLSI_DESTROY);
4632                     EXTEND(SP, 2);
4633                     PUSHMARK(SP);
4634                     PUSHs(tmpref);
4635                     PUTBACK;
4636                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4637                 
4638                 
4639                     POPSTACK;
4640                     SPAGAIN;
4641                     LEAVE;
4642                     if(SvREFCNT(tmpref) < 2) {
4643                         /* tmpref is not kept alive! */
4644                         SvREFCNT(sv)--;
4645                         SvRV_set(tmpref, NULL);
4646                         SvROK_off(tmpref);
4647                     }
4648                     SvREFCNT_dec(tmpref);
4649                 }
4650             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4651
4652
4653             if (SvREFCNT(sv)) {
4654                 if (PL_in_clean_objs)
4655                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4656                           HvNAME_get(stash));
4657                 /* DESTROY gave object new lease on life */
4658                 return;
4659             }
4660         }
4661
4662         if (SvOBJECT(sv)) {
4663             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4664             SvOBJECT_off(sv);   /* Curse the object. */
4665             if (type != SVt_PVIO)
4666                 --PL_sv_objcount;       /* XXX Might want something more general */
4667         }
4668     }
4669     if (type >= SVt_PVMG) {
4670         if (SvMAGIC(sv))
4671             mg_free(sv);
4672         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4673             SvREFCNT_dec(SvSTASH(sv));
4674     }
4675     switch (type) {
4676     case SVt_PVIO:
4677         if (IoIFP(sv) &&
4678             IoIFP(sv) != PerlIO_stdin() &&
4679             IoIFP(sv) != PerlIO_stdout() &&
4680             IoIFP(sv) != PerlIO_stderr())
4681         {
4682             io_close((IO*)sv, FALSE);
4683         }
4684         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4685             PerlDir_close(IoDIRP(sv));
4686         IoDIRP(sv) = (DIR*)NULL;
4687         Safefree(IoTOP_NAME(sv));
4688         Safefree(IoFMT_NAME(sv));
4689         Safefree(IoBOTTOM_NAME(sv));
4690         goto freescalar;
4691     case SVt_PVBM:
4692         goto freescalar;
4693     case SVt_PVCV:
4694     case SVt_PVFM:
4695         cv_undef((CV*)sv);
4696         goto freescalar;
4697     case SVt_PVHV:
4698         hv_undef((HV*)sv);
4699         break;
4700     case SVt_PVAV:
4701         av_undef((AV*)sv);
4702         break;
4703     case SVt_PVLV:
4704         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4705             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4706             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4707             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4708         }
4709         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4710             SvREFCNT_dec(LvTARG(sv));
4711         goto freescalar;
4712     case SVt_PVGV:
4713         gp_free((GV*)sv);
4714         Safefree(GvNAME(sv));
4715         /* If we're in a stash, we don't own a reference to it. However it does
4716            have a back reference to us, which needs to be cleared.  */
4717         if (GvSTASH(sv))
4718             sv_del_backref((SV*)GvSTASH(sv), sv);
4719     case SVt_PVMG:
4720     case SVt_PVNV:
4721     case SVt_PVIV:
4722       freescalar:
4723         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4724         if (SvOOK(sv)) {
4725             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4726             /* Don't even bother with turning off the OOK flag.  */
4727         }
4728     case SVt_PV:
4729     case SVt_RV:
4730         if (SvROK(sv)) {
4731             SV *target = SvRV(sv);
4732             if (SvWEAKREF(sv))
4733                 sv_del_backref(target, sv);
4734             else
4735                 SvREFCNT_dec(target);
4736         }
4737 #ifdef PERL_OLD_COPY_ON_WRITE
4738         else if (SvPVX_const(sv)) {
4739             if (SvIsCOW(sv)) {
4740                 /* I believe I need to grab the global SV mutex here and
4741                    then recheck the COW status.  */
4742                 if (DEBUG_C_TEST) {
4743                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4744                     sv_dump(sv);
4745                 }
4746                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4747                                SV_COW_NEXT_SV(sv));
4748                 /* And drop it here.  */
4749                 SvFAKE_off(sv);
4750             } else if (SvLEN(sv)) {
4751                 Safefree(SvPVX_const(sv));
4752             }
4753         }
4754 #else
4755         else if (SvPVX_const(sv) && SvLEN(sv))
4756             Safefree(SvPVX_mutable(sv));
4757         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4758             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4759             SvFAKE_off(sv);
4760         }
4761 #endif
4762         break;
4763     case SVt_NV:
4764         break;
4765     }
4766
4767     SvFLAGS(sv) &= SVf_BREAK;
4768     SvFLAGS(sv) |= SVTYPEMASK;
4769
4770     if (sv_type_details->arena) {
4771         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4772                  &PL_body_roots[type]);
4773     }
4774     else if (sv_type_details->size) {
4775         my_safefree(SvANY(sv));
4776     }
4777 }
4778
4779 /*
4780 =for apidoc sv_newref
4781
4782 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
4783 instead.
4784
4785 =cut
4786 */
4787
4788 SV *
4789 Perl_sv_newref(pTHX_ SV *sv)
4790 {
4791     if (sv)
4792         (SvREFCNT(sv))++;
4793     return sv;
4794 }
4795
4796 /*
4797 =for apidoc sv_free
4798
4799 Decrement an SV's reference count, and if it drops to zero, call
4800 C<sv_clear> to invoke destructors and free up any memory used by
4801 the body; finally, deallocate the SV's head itself.
4802 Normally called via a wrapper macro C<SvREFCNT_dec>.
4803
4804 =cut
4805 */
4806
4807 void
4808 Perl_sv_free(pTHX_ SV *sv)
4809 {
4810     dVAR;
4811     if (!sv)
4812         return;
4813     if (SvREFCNT(sv) == 0) {
4814         if (SvFLAGS(sv) & SVf_BREAK)
4815             /* this SV's refcnt has been artificially decremented to
4816              * trigger cleanup */
4817             return;
4818         if (PL_in_clean_all) /* All is fair */
4819             return;
4820         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4821             /* make sure SvREFCNT(sv)==0 happens very seldom */
4822             SvREFCNT(sv) = (~(U32)0)/2;
4823             return;
4824         }
4825         if (ckWARN_d(WARN_INTERNAL)) {
4826             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
4827                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
4828                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4829 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
4830             Perl_dump_sv_child(aTHX_ sv);
4831 #endif
4832         }
4833         return;
4834     }
4835     if (--(SvREFCNT(sv)) > 0)
4836         return;
4837     Perl_sv_free2(aTHX_ sv);
4838 }
4839
4840 void
4841 Perl_sv_free2(pTHX_ SV *sv)
4842 {
4843     dVAR;
4844 #ifdef DEBUGGING
4845     if (SvTEMP(sv)) {
4846         if (ckWARN_d(WARN_DEBUGGING))
4847             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
4848                         "Attempt to free temp prematurely: SV 0x%"UVxf
4849                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4850         return;
4851     }
4852 #endif
4853     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4854         /* make sure SvREFCNT(sv)==0 happens very seldom */
4855         SvREFCNT(sv) = (~(U32)0)/2;
4856         return;
4857     }
4858     sv_clear(sv);
4859     if (! SvREFCNT(sv))
4860         del_SV(sv);
4861 }
4862
4863 /*
4864 =for apidoc sv_len
4865
4866 Returns the length of the string in the SV. Handles magic and type
4867 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
4868
4869 =cut
4870 */
4871
4872 STRLEN
4873 Perl_sv_len(pTHX_ register SV *sv)
4874 {
4875     STRLEN len;
4876
4877     if (!sv)
4878         return 0;
4879
4880     if (SvGMAGICAL(sv))
4881         len = mg_length(sv);
4882     else
4883         (void)SvPV_const(sv, len);
4884     return len;
4885 }
4886
4887 /*
4888 =for apidoc sv_len_utf8
4889
4890 Returns the number of characters in the string in an SV, counting wide
4891 UTF-8 bytes as a single character. Handles magic and type coercion.
4892
4893 =cut
4894 */
4895
4896 /*
4897  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
4898  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
4899  * (Note that the mg_len is not the length of the mg_ptr field.)
4900  *
4901  */
4902
4903 STRLEN
4904 Perl_sv_len_utf8(pTHX_ register SV *sv)
4905 {
4906     if (!sv)
4907         return 0;
4908
4909     if (SvGMAGICAL(sv))
4910         return mg_length(sv);
4911     else
4912     {
4913         STRLEN len, ulen;
4914         const U8 *s = (U8*)SvPV_const(sv, len);
4915         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
4916
4917         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
4918             ulen = mg->mg_len;
4919 #ifdef PERL_UTF8_CACHE_ASSERT
4920             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
4921 #endif
4922         }
4923         else {
4924             ulen = Perl_utf8_length(aTHX_ s, s + len);
4925             if (!mg && !SvREADONLY(sv)) {
4926                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
4927                 mg = mg_find(sv, PERL_MAGIC_utf8);
4928                 assert(mg);
4929             }
4930             if (mg)
4931                 mg->mg_len = ulen;
4932         }
4933         return ulen;
4934     }
4935 }
4936
4937 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
4938  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4939  * between UTF-8 and byte offsets.  There are two (substr offset and substr
4940  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
4941  * and byte offset) cache positions.
4942  *
4943  * The mg_len field is used by sv_len_utf8(), see its comments.
4944  * Note that the mg_len is not the length of the mg_ptr field.
4945  *
4946  */
4947 STATIC bool
4948 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
4949                    I32 offsetp, const U8 *s, const U8 *start)
4950 {
4951     bool found = FALSE;
4952
4953     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4954         if (!*mgp)
4955             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
4956         assert(*mgp);
4957
4958         if ((*mgp)->mg_ptr)
4959             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4960         else {
4961             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
4962             (*mgp)->mg_ptr = (char *) *cachep;
4963         }
4964         assert(*cachep);
4965
4966         (*cachep)[i]   = offsetp;
4967         (*cachep)[i+1] = s - start;
4968         found = TRUE;
4969     }
4970
4971     return found;
4972 }
4973
4974 /*
4975  * S_utf8_mg_pos() is used to query and update mg_ptr field of
4976  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4977  * between UTF-8 and byte offsets.  See also the comments of
4978  * S_utf8_mg_pos_init().
4979  *
4980  */
4981 STATIC bool
4982 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
4983 {
4984     bool found = FALSE;
4985
4986     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4987         if (!*mgp)
4988             *mgp = mg_find(sv, PERL_MAGIC_utf8);
4989         if (*mgp && (*mgp)->mg_ptr) {
4990             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4991             ASSERT_UTF8_CACHE(*cachep);
4992             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
4993                  found = TRUE;
4994             else {                      /* We will skip to the right spot. */
4995                  STRLEN forw  = 0;
4996                  STRLEN backw = 0;
4997                  const U8* p = NULL;
4998
4999                  /* The assumption is that going backward is half
5000                   * the speed of going forward (that's where the
5001                   * 2 * backw in the below comes from).  (The real
5002                   * figure of course depends on the UTF-8 data.) */
5003
5004                  if ((*cachep)[i] > (STRLEN)uoff) {
5005                       forw  = uoff;
5006                       backw = (*cachep)[i] - (STRLEN)uoff;
5007
5008                       if (forw < 2 * backw)
5009                            p = start;
5010                       else
5011                            p = start + (*cachep)[i+1];
5012                  }
5013                  /* Try this only for the substr offset (i == 0),
5014                   * not for the substr length (i == 2). */
5015                  else if (i == 0) { /* (*cachep)[i] < uoff */
5016                       const STRLEN ulen = sv_len_utf8(sv);
5017
5018                       if ((STRLEN)uoff < ulen) {
5019                            forw  = (STRLEN)uoff - (*cachep)[i];
5020                            backw = ulen - (STRLEN)uoff;
5021
5022                            if (forw < 2 * backw)
5023                                 p = start + (*cachep)[i+1];
5024                            else
5025                                 p = send;
5026                       }
5027
5028                       /* If the string is not long enough for uoff,
5029                        * we could extend it, but not at this low a level. */
5030                  }
5031
5032                  if (p) {
5033                       if (forw < 2 * backw) {
5034                            while (forw--)
5035                                 p += UTF8SKIP(p);
5036                       }
5037                       else {
5038                            while (backw--) {
5039                                 p--;
5040                                 while (UTF8_IS_CONTINUATION(*p))
5041                                      p--;
5042                            }
5043                       }
5044
5045                       /* Update the cache. */
5046                       (*cachep)[i]   = (STRLEN)uoff;
5047                       (*cachep)[i+1] = p - start;
5048
5049                       /* Drop the stale "length" cache */
5050                       if (i == 0) {
5051                           (*cachep)[2] = 0;
5052                           (*cachep)[3] = 0;
5053                       }
5054
5055                       found = TRUE;
5056                  }
5057             }
5058             if (found) {        /* Setup the return values. */
5059                  *offsetp = (*cachep)[i+1];
5060                  *sp = start + *offsetp;
5061                  if (*sp >= send) {
5062                       *sp = send;
5063                       *offsetp = send - start;
5064                  }
5065                  else if (*sp < start) {
5066                       *sp = start;
5067                       *offsetp = 0;
5068                  }
5069             }
5070         }
5071 #ifdef PERL_UTF8_CACHE_ASSERT
5072         if (found) {
5073              U8 *s = start;
5074              I32 n = uoff;
5075
5076              while (n-- && s < send)
5077                   s += UTF8SKIP(s);
5078
5079              if (i == 0) {
5080                   assert(*offsetp == s - start);
5081                   assert((*cachep)[0] == (STRLEN)uoff);
5082                   assert((*cachep)[1] == *offsetp);
5083              }
5084              ASSERT_UTF8_CACHE(*cachep);
5085         }
5086 #endif
5087     }
5088
5089     return found;
5090 }
5091
5092 /*
5093 =for apidoc sv_pos_u2b
5094
5095 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5096 the start of the string, to a count of the equivalent number of bytes; if
5097 lenp is non-zero, it does the same to lenp, but this time starting from
5098 the offset, rather than from the start of the string. Handles magic and
5099 type coercion.
5100
5101 =cut
5102 */
5103
5104 /*
5105  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5106  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5107  * byte offsets.  See also the comments of S_utf8_mg_pos().
5108  *
5109  */
5110
5111 void
5112 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5113 {
5114     const U8 *start;
5115     STRLEN len;
5116
5117     if (!sv)
5118         return;
5119
5120     start = (U8*)SvPV_const(sv, len);
5121     if (len) {
5122         STRLEN boffset = 0;
5123         STRLEN *cache = 0;
5124         const U8 *s = start;
5125         I32 uoffset = *offsetp;
5126         const U8 * const send = s + len;
5127         MAGIC *mg = 0;
5128         bool found = FALSE;
5129
5130          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5131              found = TRUE;
5132          if (!found && uoffset > 0) {
5133               while (s < send && uoffset--)
5134                    s += UTF8SKIP(s);
5135               if (s >= send)
5136                    s = send;
5137               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5138                   boffset = cache[1];
5139               *offsetp = s - start;
5140          }
5141          if (lenp) {
5142               found = FALSE;
5143               start = s;
5144               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5145                   *lenp -= boffset;
5146                   found = TRUE;
5147               }
5148               if (!found && *lenp > 0) {
5149                    I32 ulen = *lenp;
5150                    if (ulen > 0)
5151                         while (s < send && ulen--)
5152                              s += UTF8SKIP(s);
5153                    if (s >= send)
5154                         s = send;
5155                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5156               }
5157               *lenp = s - start;
5158          }
5159          ASSERT_UTF8_CACHE(cache);
5160     }
5161     else {
5162          *offsetp = 0;
5163          if (lenp)
5164               *lenp = 0;
5165     }
5166
5167     return;
5168 }
5169
5170 /*
5171 =for apidoc sv_pos_b2u
5172
5173 Converts the value pointed to by offsetp from a count of bytes from the
5174 start of the string, to a count of the equivalent number of UTF-8 chars.
5175 Handles magic and type coercion.
5176
5177 =cut
5178 */
5179
5180 /*
5181  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5182  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5183  * byte offsets.  See also the comments of S_utf8_mg_pos().
5184  *
5185  */
5186
5187 void
5188 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5189 {
5190     const U8* s;
5191     STRLEN len;
5192
5193     if (!sv)
5194         return;
5195
5196     s = (const U8*)SvPV_const(sv, len);
5197     if ((I32)len < *offsetp)
5198         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5199     else {
5200         const U8* send = s + *offsetp;
5201         MAGIC* mg = NULL;
5202         STRLEN *cache = NULL;
5203
5204         len = 0;
5205
5206         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5207             mg = mg_find(sv, PERL_MAGIC_utf8);
5208             if (mg && mg->mg_ptr) {
5209                 cache = (STRLEN *) mg->mg_ptr;
5210                 if (cache[1] == (STRLEN)*offsetp) {
5211                     /* An exact match. */
5212                     *offsetp = cache[0];
5213
5214                     return;
5215                 }
5216                 else if (cache[1] < (STRLEN)*offsetp) {
5217                     /* We already know part of the way. */
5218                     len = cache[0];
5219                     s  += cache[1];
5220                     /* Let the below loop do the rest. */
5221                 }
5222                 else { /* cache[1] > *offsetp */
5223                     /* We already know all of the way, now we may
5224                      * be able to walk back.  The same assumption
5225                      * is made as in S_utf8_mg_pos(), namely that
5226                      * walking backward is twice slower than
5227                      * walking forward. */
5228                     const STRLEN forw  = *offsetp;
5229                     STRLEN backw = cache[1] - *offsetp;
5230
5231                     if (!(forw < 2 * backw)) {
5232                         const U8 *p = s + cache[1];
5233                         STRLEN ubackw = 0;
5234                         
5235                         cache[1] -= backw;
5236
5237                         while (backw--) {
5238                             p--;
5239                             while (UTF8_IS_CONTINUATION(*p)) {
5240                                 p--;
5241                                 backw--;
5242                             }
5243                             ubackw++;
5244                         }
5245
5246                         cache[0] -= ubackw;
5247                         *offsetp = cache[0];
5248
5249                         /* Drop the stale "length" cache */
5250                         cache[2] = 0;
5251                         cache[3] = 0;
5252
5253                         return;
5254                     }
5255                 }
5256             }
5257             ASSERT_UTF8_CACHE(cache);
5258         }
5259
5260         while (s < send) {
5261             STRLEN n = 1;
5262
5263             /* Call utf8n_to_uvchr() to validate the sequence
5264              * (unless a simple non-UTF character) */
5265             if (!UTF8_IS_INVARIANT(*s))
5266                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5267             if (n > 0) {
5268                 s += n;
5269                 len++;
5270             }
5271             else
5272                 break;
5273         }
5274
5275         if (!SvREADONLY(sv)) {
5276             if (!mg) {
5277                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5278                 mg = mg_find(sv, PERL_MAGIC_utf8);
5279             }
5280             assert(mg);
5281
5282             if (!mg->mg_ptr) {
5283                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5284                 mg->mg_ptr = (char *) cache;
5285             }
5286             assert(cache);
5287
5288             cache[0] = len;
5289             cache[1] = *offsetp;
5290             /* Drop the stale "length" cache */
5291             cache[2] = 0;
5292             cache[3] = 0;
5293         }
5294
5295         *offsetp = len;
5296     }
5297     return;
5298 }
5299
5300 /*
5301 =for apidoc sv_eq
5302
5303 Returns a boolean indicating whether the strings in the two SVs are
5304 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5305 coerce its args to strings if necessary.
5306
5307 =cut
5308 */
5309
5310 I32
5311 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5312 {
5313     const char *pv1;
5314     STRLEN cur1;
5315     const char *pv2;
5316     STRLEN cur2;
5317     I32  eq     = 0;
5318     char *tpv   = Nullch;
5319     SV* svrecode = Nullsv;
5320
5321     if (!sv1) {
5322         pv1 = "";
5323         cur1 = 0;
5324     }
5325     else
5326         pv1 = SvPV_const(sv1, cur1);
5327
5328     if (!sv2){
5329         pv2 = "";
5330         cur2 = 0;
5331     }
5332     else
5333         pv2 = SvPV_const(sv2, cur2);
5334
5335     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5336         /* Differing utf8ness.
5337          * Do not UTF8size the comparands as a side-effect. */
5338          if (PL_encoding) {
5339               if (SvUTF8(sv1)) {
5340                    svrecode = newSVpvn(pv2, cur2);
5341                    sv_recode_to_utf8(svrecode, PL_encoding);
5342                    pv2 = SvPV_const(svrecode, cur2);
5343               }
5344               else {
5345                    svrecode = newSVpvn(pv1, cur1);
5346                    sv_recode_to_utf8(svrecode, PL_encoding);
5347                    pv1 = SvPV_const(svrecode, cur1);
5348               }
5349               /* Now both are in UTF-8. */
5350               if (cur1 != cur2) {
5351                    SvREFCNT_dec(svrecode);
5352                    return FALSE;
5353               }
5354          }
5355          else {
5356               bool is_utf8 = TRUE;
5357
5358               if (SvUTF8(sv1)) {
5359                    /* sv1 is the UTF-8 one,
5360                     * if is equal it must be downgrade-able */
5361                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5362                                                      &cur1, &is_utf8);
5363                    if (pv != pv1)
5364                         pv1 = tpv = pv;
5365               }
5366               else {
5367                    /* sv2 is the UTF-8 one,
5368                     * if is equal it must be downgrade-able */
5369                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5370                                                       &cur2, &is_utf8);
5371                    if (pv != pv2)
5372                         pv2 = tpv = pv;
5373               }
5374               if (is_utf8) {
5375                    /* Downgrade not possible - cannot be eq */
5376                    assert (tpv == 0);
5377                    return FALSE;
5378               }
5379          }
5380     }
5381
5382     if (cur1 == cur2)
5383         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5384         
5385     if (svrecode)
5386          SvREFCNT_dec(svrecode);
5387
5388     if (tpv)
5389         Safefree(tpv);
5390
5391     return eq;
5392 }
5393
5394 /*
5395 =for apidoc sv_cmp
5396
5397 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5398 string in C<sv1> is less than, equal to, or greater than the string in
5399 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5400 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5401
5402 =cut
5403 */
5404
5405 I32
5406 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5407 {
5408     STRLEN cur1, cur2;
5409     const char *pv1, *pv2;
5410     char *tpv = Nullch;
5411     I32  cmp;
5412     SV *svrecode = Nullsv;
5413
5414     if (!sv1) {
5415         pv1 = "";
5416         cur1 = 0;
5417     }
5418     else
5419         pv1 = SvPV_const(sv1, cur1);
5420
5421     if (!sv2) {
5422         pv2 = "";
5423         cur2 = 0;
5424     }
5425     else
5426         pv2 = SvPV_const(sv2, cur2);
5427
5428     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5429         /* Differing utf8ness.
5430          * Do not UTF8size the comparands as a side-effect. */
5431         if (SvUTF8(sv1)) {
5432             if (PL_encoding) {
5433                  svrecode = newSVpvn(pv2, cur2);
5434                  sv_recode_to_utf8(svrecode, PL_encoding);
5435                  pv2 = SvPV_const(svrecode, cur2);
5436             }
5437             else {
5438                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5439             }
5440         }
5441         else {
5442             if (PL_encoding) {
5443                  svrecode = newSVpvn(pv1, cur1);
5444                  sv_recode_to_utf8(svrecode, PL_encoding);
5445                  pv1 = SvPV_const(svrecode, cur1);
5446             }
5447             else {
5448                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5449             }
5450         }
5451     }
5452
5453     if (!cur1) {
5454         cmp = cur2 ? -1 : 0;
5455     } else if (!cur2) {
5456         cmp = 1;
5457     } else {
5458         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5459
5460         if (retval) {
5461             cmp = retval < 0 ? -1 : 1;
5462         } else if (cur1 == cur2) {
5463             cmp = 0;
5464         } else {
5465             cmp = cur1 < cur2 ? -1 : 1;
5466         }
5467     }
5468
5469     if (svrecode)
5470          SvREFCNT_dec(svrecode);
5471
5472     if (tpv)
5473         Safefree(tpv);
5474
5475     return cmp;
5476 }
5477
5478 /*
5479 =for apidoc sv_cmp_locale
5480
5481 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5482 'use bytes' aware, handles get magic, and will coerce its args to strings
5483 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5484
5485 =cut
5486 */
5487
5488 I32
5489 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5490 {
5491 #ifdef USE_LOCALE_COLLATE
5492
5493     char *pv1, *pv2;
5494     STRLEN len1, len2;
5495     I32 retval;
5496
5497     if (PL_collation_standard)
5498         goto raw_compare;
5499
5500     len1 = 0;
5501     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5502     len2 = 0;
5503     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5504
5505     if (!pv1 || !len1) {
5506         if (pv2 && len2)
5507             return -1;
5508         else
5509             goto raw_compare;
5510     }
5511     else {
5512         if (!pv2 || !len2)
5513             return 1;
5514     }
5515
5516     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5517
5518     if (retval)
5519         return retval < 0 ? -1 : 1;
5520
5521     /*
5522      * When the result of collation is equality, that doesn't mean
5523      * that there are no differences -- some locales exclude some
5524      * characters from consideration.  So to avoid false equalities,
5525      * we use the raw string as a tiebreaker.
5526      */
5527
5528   raw_compare:
5529     /* FALL THROUGH */
5530
5531 #endif /* USE_LOCALE_COLLATE */
5532
5533     return sv_cmp(sv1, sv2);
5534 }
5535
5536
5537 #ifdef USE_LOCALE_COLLATE
5538
5539 /*
5540 =for apidoc sv_collxfrm
5541
5542 Add Collate Transform magic to an SV if it doesn't already have it.
5543
5544 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5545 scalar data of the variable, but transformed to such a format that a normal
5546 memory comparison can be used to compare the data according to the locale
5547 settings.
5548
5549 =cut
5550 */
5551
5552 char *
5553 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5554 {
5555     MAGIC *mg;
5556
5557     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5558     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5559         const char *s;
5560         char *xf;
5561         STRLEN len, xlen;
5562
5563         if (mg)
5564             Safefree(mg->mg_ptr);
5565         s = SvPV_const(sv, len);
5566         if ((xf = mem_collxfrm(s, len, &xlen))) {
5567             if (SvREADONLY(sv)) {
5568                 SAVEFREEPV(xf);
5569                 *nxp = xlen;
5570                 return xf + sizeof(PL_collation_ix);
5571             }
5572             if (! mg) {
5573                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5574                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5575                 assert(mg);
5576             }
5577             mg->mg_ptr = xf;
5578             mg->mg_len = xlen;
5579         }
5580         else {
5581             if (mg) {
5582                 mg->mg_ptr = NULL;
5583                 mg->mg_len = -1;
5584             }
5585         }
5586     }
5587     if (mg && mg->mg_ptr) {
5588         *nxp = mg->mg_len;
5589         return mg->mg_ptr + sizeof(PL_collation_ix);
5590     }
5591     else {
5592         *nxp = 0;
5593         return NULL;
5594     }
5595 }
5596
5597 #endif /* USE_LOCALE_COLLATE */
5598
5599 /*
5600 =for apidoc sv_gets
5601
5602 Get a line from the filehandle and store it into the SV, optionally
5603 appending to the currently-stored string.
5604
5605 =cut
5606 */
5607
5608 char *
5609 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5610 {
5611     const char *rsptr;
5612     STRLEN rslen;
5613     register STDCHAR rslast;
5614     register STDCHAR *bp;
5615     register I32 cnt;
5616     I32 i = 0;
5617     I32 rspara = 0;
5618     I32 recsize;
5619
5620     if (SvTHINKFIRST(sv))
5621         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5622     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5623        from <>.
5624        However, perlbench says it's slower, because the existing swipe code
5625        is faster than copy on write.
5626        Swings and roundabouts.  */
5627     SvUPGRADE(sv, SVt_PV);
5628
5629     SvSCREAM_off(sv);
5630
5631     if (append) {
5632         if (PerlIO_isutf8(fp)) {
5633             if (!SvUTF8(sv)) {
5634                 sv_utf8_upgrade_nomg(sv);
5635                 sv_pos_u2b(sv,&append,0);
5636             }
5637         } else if (SvUTF8(sv)) {
5638             SV * const tsv = NEWSV(0,0);
5639             sv_gets(tsv, fp, 0);
5640             sv_utf8_upgrade_nomg(tsv);
5641             SvCUR_set(sv,append);
5642             sv_catsv(sv,tsv);
5643             sv_free(tsv);
5644             goto return_string_or_null;
5645         }
5646     }
5647
5648     SvPOK_only(sv);
5649     if (PerlIO_isutf8(fp))
5650         SvUTF8_on(sv);
5651
5652     if (IN_PERL_COMPILETIME) {
5653         /* we always read code in line mode */
5654         rsptr = "\n";
5655         rslen = 1;
5656     }
5657     else if (RsSNARF(PL_rs)) {
5658         /* If it is a regular disk file use size from stat() as estimate
5659            of amount we are going to read - may result in malloc-ing
5660            more memory than we realy need if layers bellow reduce
5661            size we read (e.g. CRLF or a gzip layer)
5662          */
5663         Stat_t st;
5664         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5665             const Off_t offset = PerlIO_tell(fp);
5666             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5667                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5668             }
5669         }
5670         rsptr = NULL;
5671         rslen = 0;
5672     }
5673     else if (RsRECORD(PL_rs)) {
5674       I32 bytesread;
5675       char *buffer;
5676
5677       /* Grab the size of the record we're getting */
5678       recsize = SvIV(SvRV(PL_rs));
5679       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5680       /* Go yank in */
5681 #ifdef VMS
5682       /* VMS wants read instead of fread, because fread doesn't respect */
5683       /* RMS record boundaries. This is not necessarily a good thing to be */
5684       /* doing, but we've got no other real choice - except avoid stdio
5685          as implementation - perhaps write a :vms layer ?
5686        */
5687       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5688 #else
5689       bytesread = PerlIO_read(fp, buffer, recsize);
5690 #endif
5691       if (bytesread < 0)
5692           bytesread = 0;
5693       SvCUR_set(sv, bytesread += append);
5694       buffer[bytesread] = '\0';
5695       goto return_string_or_null;
5696     }
5697     else if (RsPARA(PL_rs)) {
5698         rsptr = "\n\n";
5699         rslen = 2;
5700         rspara = 1;
5701     }
5702     else {
5703         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5704         if (PerlIO_isutf8(fp)) {
5705             rsptr = SvPVutf8(PL_rs, rslen);
5706         }
5707         else {
5708             if (SvUTF8(PL_rs)) {
5709                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5710                     Perl_croak(aTHX_ "Wide character in $/");
5711                 }
5712             }
5713             rsptr = SvPV_const(PL_rs, rslen);
5714         }
5715     }
5716
5717     rslast = rslen ? rsptr[rslen - 1] : '\0';
5718
5719     if (rspara) {               /* have to do this both before and after */
5720         do {                    /* to make sure file boundaries work right */
5721             if (PerlIO_eof(fp))
5722                 return 0;
5723             i = PerlIO_getc(fp);
5724             if (i != '\n') {
5725                 if (i == -1)
5726                     return 0;
5727                 PerlIO_ungetc(fp,i);
5728                 break;
5729             }
5730         } while (i != EOF);
5731     }
5732
5733     /* See if we know enough about I/O mechanism to cheat it ! */
5734
5735     /* This used to be #ifdef test - it is made run-time test for ease
5736        of abstracting out stdio interface. One call should be cheap
5737        enough here - and may even be a macro allowing compile
5738        time optimization.
5739      */
5740
5741     if (PerlIO_fast_gets(fp)) {
5742
5743     /*
5744      * We're going to steal some values from the stdio struct
5745      * and put EVERYTHING in the innermost loop into registers.
5746      */
5747     register STDCHAR *ptr;
5748     STRLEN bpx;
5749     I32 shortbuffered;
5750
5751 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5752     /* An ungetc()d char is handled separately from the regular
5753      * buffer, so we getc() it back out and stuff it in the buffer.
5754      */
5755     i = PerlIO_getc(fp);
5756     if (i == EOF) return 0;
5757     *(--((*fp)->_ptr)) = (unsigned char) i;
5758     (*fp)->_cnt++;
5759 #endif
5760
5761     /* Here is some breathtakingly efficient cheating */
5762
5763     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5764     /* make sure we have the room */
5765     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5766         /* Not room for all of it
5767            if we are looking for a separator and room for some
5768          */
5769         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5770             /* just process what we have room for */
5771             shortbuffered = cnt - SvLEN(sv) + append + 1;
5772             cnt -= shortbuffered;
5773         }
5774         else {
5775             shortbuffered = 0;
5776             /* remember that cnt can be negative */
5777             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5778         }
5779     }
5780     else
5781         shortbuffered = 0;
5782     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
5783     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
5784     DEBUG_P(PerlIO_printf(Perl_debug_log,
5785         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5786     DEBUG_P(PerlIO_printf(Perl_debug_log,
5787         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5788                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5789                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
5790     for (;;) {
5791       screamer:
5792         if (cnt > 0) {
5793             if (rslen) {
5794                 while (cnt > 0) {                    /* this     |  eat */
5795                     cnt--;
5796                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
5797                         goto thats_all_folks;        /* screams  |  sed :-) */
5798                 }
5799             }
5800             else {
5801                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
5802                 bp += cnt;                           /* screams  |  dust */
5803                 ptr += cnt;                          /* louder   |  sed :-) */
5804                 cnt = 0;
5805             }
5806         }
5807         
5808         if (shortbuffered) {            /* oh well, must extend */
5809             cnt = shortbuffered;
5810             shortbuffered = 0;
5811             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
5812             SvCUR_set(sv, bpx);
5813             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
5814             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
5815             continue;
5816         }
5817
5818         DEBUG_P(PerlIO_printf(Perl_debug_log,
5819                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
5820                               PTR2UV(ptr),(long)cnt));
5821         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
5822 #if 0
5823         DEBUG_P(PerlIO_printf(Perl_debug_log,
5824             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5825             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5826             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5827 #endif
5828         /* This used to call 'filbuf' in stdio form, but as that behaves like
5829            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
5830            another abstraction.  */
5831         i   = PerlIO_getc(fp);          /* get more characters */
5832 #if 0
5833         DEBUG_P(PerlIO_printf(Perl_debug_log,
5834             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5835             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5836             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5837 #endif
5838         cnt = PerlIO_get_cnt(fp);
5839         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
5840         DEBUG_P(PerlIO_printf(Perl_debug_log,
5841             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5842
5843         if (i == EOF)                   /* all done for ever? */
5844             goto thats_really_all_folks;
5845
5846         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
5847         SvCUR_set(sv, bpx);
5848         SvGROW(sv, bpx + cnt + 2);
5849         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
5850
5851         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
5852
5853         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
5854             goto thats_all_folks;
5855     }
5856
5857 thats_all_folks:
5858     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
5859           memNE((char*)bp - rslen, rsptr, rslen))
5860         goto screamer;                          /* go back to the fray */
5861 thats_really_all_folks:
5862     if (shortbuffered)
5863         cnt += shortbuffered;
5864         DEBUG_P(PerlIO_printf(Perl_debug_log,
5865             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5866     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
5867     DEBUG_P(PerlIO_printf(Perl_debug_log,
5868         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5869         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5870         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5871     *bp = '\0';
5872     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
5873     DEBUG_P(PerlIO_printf(Perl_debug_log,
5874         "Screamer: done, len=%ld, string=|%.*s|\n",
5875         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
5876     }
5877    else
5878     {
5879        /*The big, slow, and stupid way. */
5880 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
5881         STDCHAR *buf = 0;
5882         Newx(buf, 8192, STDCHAR);
5883         assert(buf);
5884 #else
5885         STDCHAR buf[8192];
5886 #endif
5887
5888 screamer2:
5889         if (rslen) {
5890             register const STDCHAR * const bpe = buf + sizeof(buf);
5891             bp = buf;
5892             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
5893                 ; /* keep reading */
5894             cnt = bp - buf;
5895         }
5896         else {
5897             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
5898             /* Accomodate broken VAXC compiler, which applies U8 cast to
5899              * both args of ?: operator, causing EOF to change into 255
5900              */
5901             if (cnt > 0)
5902                  i = (U8)buf[cnt - 1];
5903             else
5904                  i = EOF;
5905         }
5906
5907         if (cnt < 0)
5908             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
5909         if (append)
5910              sv_catpvn(sv, (char *) buf, cnt);
5911         else
5912              sv_setpvn(sv, (char *) buf, cnt);
5913
5914         if (i != EOF &&                 /* joy */
5915             (!rslen ||
5916              SvCUR(sv) < rslen ||
5917              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
5918         {
5919             append = -1;
5920             /*
5921              * If we're reading from a TTY and we get a short read,
5922              * indicating that the user hit his EOF character, we need
5923              * to notice it now, because if we try to read from the TTY
5924              * again, the EOF condition will disappear.
5925              *
5926              * The comparison of cnt to sizeof(buf) is an optimization
5927              * that prevents unnecessary calls to feof().
5928              *
5929              * - jik 9/25/96
5930              */
5931             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
5932                 goto screamer2;
5933         }
5934
5935 #ifdef USE_HEAP_INSTEAD_OF_STACK
5936         Safefree(buf);
5937 #endif
5938     }
5939
5940     if (rspara) {               /* have to do this both before and after */
5941         while (i != EOF) {      /* to make sure file boundaries work right */
5942             i = PerlIO_getc(fp);
5943             if (i != '\n') {
5944                 PerlIO_ungetc(fp,i);
5945                 break;
5946             }
5947         }
5948     }
5949
5950 return_string_or_null:
5951     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
5952 }
5953
5954 /*
5955 =for apidoc sv_inc
5956
5957 Auto-increment of the value in the SV, doing string to numeric conversion
5958 if necessary. Handles 'get' magic.
5959
5960 =cut
5961 */
5962
5963 void
5964 Perl_sv_inc(pTHX_ register SV *sv)
5965 {
5966     register char *d;
5967     int flags;
5968
5969     if (!sv)
5970         return;
5971     SvGETMAGIC(sv);
5972     if (SvTHINKFIRST(sv)) {
5973         if (SvIsCOW(sv))
5974             sv_force_normal_flags(sv, 0);
5975         if (SvREADONLY(sv)) {
5976             if (IN_PERL_RUNTIME)
5977                 Perl_croak(aTHX_ PL_no_modify);
5978         }
5979         if (SvROK(sv)) {
5980             IV i;
5981             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
5982                 return;
5983             i = PTR2IV(SvRV(sv));
5984             sv_unref(sv);
5985             sv_setiv(sv, i);
5986         }
5987     }
5988     flags = SvFLAGS(sv);
5989     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
5990         /* It's (privately or publicly) a float, but not tested as an
5991            integer, so test it to see. */
5992         (void) SvIV(sv);
5993         flags = SvFLAGS(sv);
5994     }
5995     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
5996         /* It's publicly an integer, or privately an integer-not-float */
5997 #ifdef PERL_PRESERVE_IVUV
5998       oops_its_int:
5999 #endif
6000         if (SvIsUV(sv)) {
6001             if (SvUVX(sv) == UV_MAX)
6002                 sv_setnv(sv, UV_MAX_P1);
6003             else
6004                 (void)SvIOK_only_UV(sv);
6005                 SvUV_set(sv, SvUVX(sv) + 1);
6006         } else {
6007             if (SvIVX(sv) == IV_MAX)
6008                 sv_setuv(sv, (UV)IV_MAX + 1);
6009             else {
6010                 (void)SvIOK_only(sv);
6011                 SvIV_set(sv, SvIVX(sv) + 1);
6012             }   
6013         }
6014         return;
6015     }
6016     if (flags & SVp_NOK) {
6017         (void)SvNOK_only(sv);
6018         SvNV_set(sv, SvNVX(sv) + 1.0);
6019         return;
6020     }
6021
6022     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6023         if ((flags & SVTYPEMASK) < SVt_PVIV)
6024             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6025         (void)SvIOK_only(sv);
6026         SvIV_set(sv, 1);
6027         return;
6028     }
6029     d = SvPVX(sv);
6030     while (isALPHA(*d)) d++;
6031     while (isDIGIT(*d)) d++;
6032     if (*d) {
6033 #ifdef PERL_PRESERVE_IVUV
6034         /* Got to punt this as an integer if needs be, but we don't issue
6035            warnings. Probably ought to make the sv_iv_please() that does
6036            the conversion if possible, and silently.  */
6037         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6038         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6039             /* Need to try really hard to see if it's an integer.
6040                9.22337203685478e+18 is an integer.
6041                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6042                so $a="9.22337203685478e+18"; $a+0; $a++
6043                needs to be the same as $a="9.22337203685478e+18"; $a++
6044                or we go insane. */
6045         
6046             (void) sv_2iv(sv);
6047             if (SvIOK(sv))
6048                 goto oops_its_int;
6049
6050             /* sv_2iv *should* have made this an NV */
6051             if (flags & SVp_NOK) {
6052                 (void)SvNOK_only(sv);
6053                 SvNV_set(sv, SvNVX(sv) + 1.0);
6054                 return;
6055             }
6056             /* I don't think we can get here. Maybe I should assert this
6057                And if we do get here I suspect that sv_setnv will croak. NWC
6058                Fall through. */
6059 #if defined(USE_LONG_DOUBLE)
6060             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6061                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6062 #else
6063             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6064                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6065 #endif
6066         }
6067 #endif /* PERL_PRESERVE_IVUV */
6068         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6069         return;
6070     }
6071     d--;
6072     while (d >= SvPVX_const(sv)) {
6073         if (isDIGIT(*d)) {
6074             if (++*d <= '9')
6075                 return;
6076             *(d--) = '0';
6077         }
6078         else {
6079 #ifdef EBCDIC
6080             /* MKS: The original code here died if letters weren't consecutive.
6081              * at least it didn't have to worry about non-C locales.  The
6082              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6083              * arranged in order (although not consecutively) and that only
6084              * [A-Za-z] are accepted by isALPHA in the C locale.
6085              */
6086             if (*d != 'z' && *d != 'Z') {
6087                 do { ++*d; } while (!isALPHA(*d));
6088                 return;
6089             }
6090             *(d--) -= 'z' - 'a';
6091 #else
6092             ++*d;
6093             if (isALPHA(*d))
6094                 return;
6095             *(d--) -= 'z' - 'a' + 1;
6096 #endif
6097         }
6098     }
6099     /* oh,oh, the number grew */
6100     SvGROW(sv, SvCUR(sv) + 2);
6101     SvCUR_set(sv, SvCUR(sv) + 1);
6102     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6103         *d = d[-1];
6104     if (isDIGIT(d[1]))
6105         *d = '1';
6106     else
6107         *d = d[1];
6108 }
6109
6110 /*
6111 =for apidoc sv_dec
6112
6113 Auto-decrement of the value in the SV, doing string to numeric conversion
6114 if necessary. Handles 'get' magic.
6115
6116 =cut
6117 */
6118
6119 void
6120 Perl_sv_dec(pTHX_ register SV *sv)
6121 {
6122     int flags;
6123
6124     if (!sv)
6125         return;
6126     SvGETMAGIC(sv);
6127     if (SvTHINKFIRST(sv)) {
6128         if (SvIsCOW(sv))
6129             sv_force_normal_flags(sv, 0);
6130         if (SvREADONLY(sv)) {
6131             if (IN_PERL_RUNTIME)
6132                 Perl_croak(aTHX_ PL_no_modify);
6133         }
6134         if (SvROK(sv)) {
6135             IV i;
6136             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6137                 return;
6138             i = PTR2IV(SvRV(sv));
6139             sv_unref(sv);
6140             sv_setiv(sv, i);
6141         }
6142     }
6143     /* Unlike sv_inc we don't have to worry about string-never-numbers
6144        and keeping them magic. But we mustn't warn on punting */
6145     flags = SvFLAGS(sv);
6146     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6147         /* It's publicly an integer, or privately an integer-not-float */
6148 #ifdef PERL_PRESERVE_IVUV
6149       oops_its_int:
6150 #endif
6151         if (SvIsUV(sv)) {
6152             if (SvUVX(sv) == 0) {
6153                 (void)SvIOK_only(sv);
6154                 SvIV_set(sv, -1);
6155             }
6156             else {
6157                 (void)SvIOK_only_UV(sv);
6158                 SvUV_set(sv, SvUVX(sv) - 1);
6159             }   
6160         } else {
6161             if (SvIVX(sv) == IV_MIN)
6162                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6163             else {
6164                 (void)SvIOK_only(sv);
6165                 SvIV_set(sv, SvIVX(sv) - 1);
6166             }   
6167         }
6168         return;
6169     }
6170     if (flags & SVp_NOK) {
6171         SvNV_set(sv, SvNVX(sv) - 1.0);
6172         (void)SvNOK_only(sv);
6173         return;
6174     }
6175     if (!(flags & SVp_POK)) {
6176         if ((flags & SVTYPEMASK) < SVt_PVIV)
6177             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6178         SvIV_set(sv, -1);
6179         (void)SvIOK_only(sv);
6180         return;
6181     }
6182 #ifdef PERL_PRESERVE_IVUV
6183     {
6184         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6185         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6186             /* Need to try really hard to see if it's an integer.
6187                9.22337203685478e+18 is an integer.
6188                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6189                so $a="9.22337203685478e+18"; $a+0; $a--
6190                needs to be the same as $a="9.22337203685478e+18"; $a--
6191                or we go insane. */
6192         
6193             (void) sv_2iv(sv);
6194             if (SvIOK(sv))
6195                 goto oops_its_int;
6196
6197             /* sv_2iv *should* have made this an NV */
6198             if (flags & SVp_NOK) {
6199                 (void)SvNOK_only(sv);
6200                 SvNV_set(sv, SvNVX(sv) - 1.0);
6201                 return;
6202             }
6203             /* I don't think we can get here. Maybe I should assert this
6204                And if we do get here I suspect that sv_setnv will croak. NWC
6205                Fall through. */
6206 #if defined(USE_LONG_DOUBLE)
6207             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6208                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6209 #else
6210             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6211                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6212 #endif
6213         }
6214     }
6215 #endif /* PERL_PRESERVE_IVUV */
6216     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6217 }
6218
6219 /*
6220 =for apidoc sv_mortalcopy
6221
6222 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6223 The new SV is marked as mortal. It will be destroyed "soon", either by an
6224 explicit call to FREETMPS, or by an implicit call at places such as
6225 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6226
6227 =cut
6228 */
6229
6230 /* Make a string that will exist for the duration of the expression
6231  * evaluation.  Actually, it may have to last longer than that, but
6232  * hopefully we won't free it until it has been assigned to a
6233  * permanent location. */
6234
6235 SV *
6236 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6237 {
6238     register SV *sv;
6239
6240     new_SV(sv);
6241     sv_setsv(sv,oldstr);
6242     EXTEND_MORTAL(1);
6243     PL_tmps_stack[++PL_tmps_ix] = sv;
6244     SvTEMP_on(sv);
6245     return sv;
6246 }
6247
6248 /*
6249 =for apidoc sv_newmortal
6250
6251 Creates a new null SV which is mortal.  The reference count of the SV is
6252 set to 1. It will be destroyed "soon", either by an explicit call to
6253 FREETMPS, or by an implicit call at places such as statement boundaries.
6254 See also C<sv_mortalcopy> and C<sv_2mortal>.
6255
6256 =cut
6257 */
6258
6259 SV *
6260 Perl_sv_newmortal(pTHX)
6261 {
6262     register SV *sv;
6263
6264     new_SV(sv);
6265     SvFLAGS(sv) = SVs_TEMP;
6266     EXTEND_MORTAL(1);
6267     PL_tmps_stack[++PL_tmps_ix] = sv;
6268     return sv;
6269 }
6270
6271 /*
6272 =for apidoc sv_2mortal
6273
6274 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6275 by an explicit call to FREETMPS, or by an implicit call at places such as
6276 statement boundaries.  SvTEMP() is turned on which means that the SV's
6277 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6278 and C<sv_mortalcopy>.
6279
6280 =cut
6281 */
6282
6283 SV *
6284 Perl_sv_2mortal(pTHX_ register SV *sv)
6285 {
6286     dVAR;
6287     if (!sv)
6288         return sv;
6289     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6290         return sv;
6291     EXTEND_MORTAL(1);
6292     PL_tmps_stack[++PL_tmps_ix] = sv;
6293     SvTEMP_on(sv);
6294     return sv;
6295 }
6296
6297 /*
6298 =for apidoc newSVpv
6299
6300 Creates a new SV and copies a string into it.  The reference count for the
6301 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6302 strlen().  For efficiency, consider using C<newSVpvn> instead.
6303
6304 =cut
6305 */
6306
6307 SV *
6308 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6309 {
6310     register SV *sv;
6311
6312     new_SV(sv);
6313     sv_setpvn(sv,s,len ? len : strlen(s));
6314     return sv;
6315 }
6316
6317 /*
6318 =for apidoc newSVpvn
6319
6320 Creates a new SV and copies a string into it.  The reference count for the
6321 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6322 string.  You are responsible for ensuring that the source string is at least
6323 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6324
6325 =cut
6326 */
6327
6328 SV *
6329 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6330 {
6331     register SV *sv;
6332
6333     new_SV(sv);
6334     sv_setpvn(sv,s,len);
6335     return sv;
6336 }
6337
6338
6339 /*
6340 =for apidoc newSVhek
6341
6342 Creates a new SV from the hash key structure.  It will generate scalars that
6343 point to the shared string table where possible. Returns a new (undefined)
6344 SV if the hek is NULL.
6345
6346 =cut
6347 */
6348
6349 SV *
6350 Perl_newSVhek(pTHX_ const HEK *hek)
6351 {
6352     if (!hek) {
6353         SV *sv;
6354
6355         new_SV(sv);
6356         return sv;
6357     }
6358
6359     if (HEK_LEN(hek) == HEf_SVKEY) {
6360         return newSVsv(*(SV**)HEK_KEY(hek));
6361     } else {
6362         const int flags = HEK_FLAGS(hek);
6363         if (flags & HVhek_WASUTF8) {
6364             /* Trouble :-)
6365                Andreas would like keys he put in as utf8 to come back as utf8
6366             */
6367             STRLEN utf8_len = HEK_LEN(hek);
6368             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6369             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6370
6371             SvUTF8_on (sv);
6372             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6373             return sv;
6374         } else if (flags & HVhek_REHASH) {
6375             /* We don't have a pointer to the hv, so we have to replicate the
6376                flag into every HEK. This hv is using custom a hasing
6377                algorithm. Hence we can't return a shared string scalar, as
6378                that would contain the (wrong) hash value, and might get passed
6379                into an hv routine with a regular hash  */
6380
6381             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6382             if (HEK_UTF8(hek))
6383                 SvUTF8_on (sv);
6384             return sv;
6385         }
6386         /* This will be overwhelminly the most common case.  */
6387         return newSVpvn_share(HEK_KEY(hek),
6388                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6389                               HEK_HASH(hek));
6390     }
6391 }
6392
6393 /*
6394 =for apidoc newSVpvn_share
6395
6396 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6397 table. If the string does not already exist in the table, it is created
6398 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6399 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6400 otherwise the hash is computed.  The idea here is that as the string table
6401 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6402 hash lookup will avoid string compare.
6403
6404 =cut
6405 */
6406
6407 SV *
6408 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6409 {
6410     register SV *sv;
6411     bool is_utf8 = FALSE;
6412     if (len < 0) {
6413         STRLEN tmplen = -len;
6414         is_utf8 = TRUE;
6415         /* See the note in hv.c:hv_fetch() --jhi */
6416         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6417         len = tmplen;
6418     }
6419     if (!hash)
6420         PERL_HASH(hash, src, len);
6421     new_SV(sv);
6422     sv_upgrade(sv, SVt_PV);
6423     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6424     SvCUR_set(sv, len);
6425     SvLEN_set(sv, 0);
6426     SvREADONLY_on(sv);
6427     SvFAKE_on(sv);
6428     SvPOK_on(sv);
6429     if (is_utf8)
6430         SvUTF8_on(sv);
6431     return sv;
6432 }
6433
6434
6435 #if defined(PERL_IMPLICIT_CONTEXT)
6436
6437 /* pTHX_ magic can't cope with varargs, so this is a no-context
6438  * version of the main function, (which may itself be aliased to us).
6439  * Don't access this version directly.
6440  */
6441
6442 SV *
6443 Perl_newSVpvf_nocontext(const char* pat, ...)
6444 {
6445     dTHX;
6446     register SV *sv;
6447     va_list args;
6448     va_start(args, pat);
6449     sv = vnewSVpvf(pat, &args);
6450     va_end(args);
6451     return sv;
6452 }
6453 #endif
6454
6455 /*
6456 =for apidoc newSVpvf
6457
6458 Creates a new SV and initializes it with the string formatted like
6459 C<sprintf>.
6460
6461 =cut
6462 */
6463
6464 SV *
6465 Perl_newSVpvf(pTHX_ const char* pat, ...)
6466 {
6467     register SV *sv;
6468     va_list args;
6469     va_start(args, pat);
6470     sv = vnewSVpvf(pat, &args);
6471     va_end(args);
6472     return sv;
6473 }
6474
6475 /* backend for newSVpvf() and newSVpvf_nocontext() */
6476
6477 SV *
6478 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6479 {
6480     register SV *sv;
6481     new_SV(sv);
6482     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6483     return sv;
6484 }
6485
6486 /*
6487 =for apidoc newSVnv
6488
6489 Creates a new SV and copies a floating point value into it.
6490 The reference count for the SV is set to 1.
6491
6492 =cut
6493 */
6494
6495 SV *
6496 Perl_newSVnv(pTHX_ NV n)
6497 {
6498     register SV *sv;
6499
6500     new_SV(sv);
6501     sv_setnv(sv,n);
6502     return sv;
6503 }
6504
6505 /*
6506 =for apidoc newSViv
6507
6508 Creates a new SV and copies an integer into it.  The reference count for the
6509 SV is set to 1.
6510
6511 =cut
6512 */
6513
6514 SV *
6515 Perl_newSViv(pTHX_ IV i)
6516 {
6517     register SV *sv;
6518
6519     new_SV(sv);
6520     sv_setiv(sv,i);
6521     return sv;
6522 }
6523
6524 /*
6525 =for apidoc newSVuv
6526
6527 Creates a new SV and copies an unsigned integer into it.
6528 The reference count for the SV is set to 1.
6529
6530 =cut
6531 */
6532
6533 SV *
6534 Perl_newSVuv(pTHX_ UV u)
6535 {
6536     register SV *sv;
6537
6538     new_SV(sv);
6539     sv_setuv(sv,u);
6540     return sv;
6541 }
6542
6543 /*
6544 =for apidoc newRV_noinc
6545
6546 Creates an RV wrapper for an SV.  The reference count for the original
6547 SV is B<not> incremented.
6548
6549 =cut
6550 */
6551
6552 SV *
6553 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6554 {
6555     register SV *sv;
6556
6557     new_SV(sv);
6558     sv_upgrade(sv, SVt_RV);
6559     SvTEMP_off(tmpRef);
6560     SvRV_set(sv, tmpRef);
6561     SvROK_on(sv);
6562     return sv;
6563 }
6564
6565 /* newRV_inc is the official function name to use now.
6566  * newRV_inc is in fact #defined to newRV in sv.h
6567  */
6568
6569 SV *
6570 Perl_newRV(pTHX_ SV *tmpRef)
6571 {
6572     return newRV_noinc(SvREFCNT_inc(tmpRef));
6573 }
6574
6575 /*
6576 =for apidoc newSVsv
6577
6578 Creates a new SV which is an exact duplicate of the original SV.
6579 (Uses C<sv_setsv>).
6580
6581 =cut
6582 */
6583
6584 SV *
6585 Perl_newSVsv(pTHX_ register SV *old)
6586 {
6587     register SV *sv;
6588
6589     if (!old)
6590         return Nullsv;
6591     if (SvTYPE(old) == SVTYPEMASK) {
6592         if (ckWARN_d(WARN_INTERNAL))
6593             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6594         return Nullsv;
6595     }
6596     new_SV(sv);
6597     /* SV_GMAGIC is the default for sv_setv()
6598        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6599        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6600     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6601     return sv;
6602 }
6603
6604 /*
6605 =for apidoc sv_reset
6606
6607 Underlying implementation for the C<reset> Perl function.
6608 Note that the perl-level function is vaguely deprecated.
6609
6610 =cut
6611 */
6612
6613 void
6614 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6615 {
6616     dVAR;
6617     char todo[PERL_UCHAR_MAX+1];
6618
6619     if (!stash)
6620         return;
6621
6622     if (!*s) {          /* reset ?? searches */
6623         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6624         if (mg) {
6625             PMOP *pm = (PMOP *) mg->mg_obj;
6626             while (pm) {
6627                 pm->op_pmdynflags &= ~PMdf_USED;
6628                 pm = pm->op_pmnext;
6629             }
6630         }
6631         return;
6632     }
6633
6634     /* reset variables */
6635
6636     if (!HvARRAY(stash))
6637         return;
6638
6639     Zero(todo, 256, char);
6640     while (*s) {
6641         I32 max;
6642         I32 i = (unsigned char)*s;
6643         if (s[1] == '-') {
6644             s += 2;
6645         }
6646         max = (unsigned char)*s++;
6647         for ( ; i <= max; i++) {
6648             todo[i] = 1;
6649         }
6650         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6651             HE *entry;
6652             for (entry = HvARRAY(stash)[i];
6653                  entry;
6654                  entry = HeNEXT(entry))
6655             {
6656                 register GV *gv;
6657                 register SV *sv;
6658
6659                 if (!todo[(U8)*HeKEY(entry)])
6660                     continue;
6661                 gv = (GV*)HeVAL(entry);
6662                 sv = GvSV(gv);
6663                 if (sv) {
6664                     if (SvTHINKFIRST(sv)) {
6665                         if (!SvREADONLY(sv) && SvROK(sv))
6666                             sv_unref(sv);
6667                         /* XXX Is this continue a bug? Why should THINKFIRST
6668                            exempt us from resetting arrays and hashes?  */
6669                         continue;
6670                     }
6671                     SvOK_off(sv);
6672                     if (SvTYPE(sv) >= SVt_PV) {
6673                         SvCUR_set(sv, 0);
6674                         if (SvPVX_const(sv) != Nullch)
6675                             *SvPVX(sv) = '\0';
6676                         SvTAINT(sv);
6677                     }
6678                 }
6679                 if (GvAV(gv)) {
6680                     av_clear(GvAV(gv));
6681                 }
6682                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6683 #if defined(VMS)
6684                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6685 #else /* ! VMS */
6686                     hv_clear(GvHV(gv));
6687 #  if defined(USE_ENVIRON_ARRAY)
6688                     if (gv == PL_envgv)
6689                         my_clearenv();
6690 #  endif /* USE_ENVIRON_ARRAY */
6691 #endif /* VMS */
6692                 }
6693             }
6694         }
6695     }
6696 }
6697
6698 /*
6699 =for apidoc sv_2io
6700
6701 Using various gambits, try to get an IO from an SV: the IO slot if its a
6702 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6703 named after the PV if we're a string.
6704
6705 =cut
6706 */
6707
6708 IO*
6709 Perl_sv_2io(pTHX_ SV *sv)
6710 {
6711     IO* io;
6712     GV* gv;
6713
6714     switch (SvTYPE(sv)) {
6715     case SVt_PVIO:
6716         io = (IO*)sv;
6717         break;
6718     case SVt_PVGV:
6719         gv = (GV*)sv;
6720         io = GvIO(gv);
6721         if (!io)
6722             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6723         break;
6724     default:
6725         if (!SvOK(sv))
6726             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6727         if (SvROK(sv))
6728             return sv_2io(SvRV(sv));
6729         gv = gv_fetchsv(sv, FALSE, SVt_PVIO);
6730         if (gv)
6731             io = GvIO(gv);
6732         else
6733             io = 0;
6734         if (!io)
6735             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6736         break;
6737     }
6738     return io;
6739 }
6740
6741 /*
6742 =for apidoc sv_2cv
6743
6744 Using various gambits, try to get a CV from an SV; in addition, try if
6745 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6746
6747 =cut
6748 */
6749
6750 CV *
6751 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6752 {
6753     dVAR;
6754     GV *gv = Nullgv;
6755     CV *cv = Nullcv;
6756
6757     if (!sv)
6758         return *gvp = Nullgv, Nullcv;
6759     switch (SvTYPE(sv)) {
6760     case SVt_PVCV:
6761         *st = CvSTASH(sv);
6762         *gvp = Nullgv;
6763         return (CV*)sv;
6764     case SVt_PVHV:
6765     case SVt_PVAV:
6766         *gvp = Nullgv;
6767         return Nullcv;
6768     case SVt_PVGV:
6769         gv = (GV*)sv;
6770         *gvp = gv;
6771         *st = GvESTASH(gv);
6772         goto fix_gv;
6773
6774     default:
6775         SvGETMAGIC(sv);
6776         if (SvROK(sv)) {
6777             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6778             tryAMAGICunDEREF(to_cv);
6779
6780             sv = SvRV(sv);
6781             if (SvTYPE(sv) == SVt_PVCV) {
6782                 cv = (CV*)sv;
6783                 *gvp = Nullgv;
6784                 *st = CvSTASH(cv);
6785                 return cv;
6786             }
6787             else if(isGV(sv))
6788                 gv = (GV*)sv;
6789             else
6790                 Perl_croak(aTHX_ "Not a subroutine reference");
6791         }
6792         else if (isGV(sv))
6793             gv = (GV*)sv;
6794         else
6795             gv = gv_fetchsv(sv, lref, SVt_PVCV);
6796         *gvp = gv;
6797         if (!gv)
6798             return Nullcv;
6799         *st = GvESTASH(gv);
6800     fix_gv:
6801         if (lref && !GvCVu(gv)) {
6802             SV *tmpsv;
6803             ENTER;
6804             tmpsv = NEWSV(704,0);
6805             gv_efullname3(tmpsv, gv, Nullch);
6806             /* XXX this is probably not what they think they're getting.
6807              * It has the same effect as "sub name;", i.e. just a forward
6808              * declaration! */
6809             newSUB(start_subparse(FALSE, 0),
6810                    newSVOP(OP_CONST, 0, tmpsv),
6811                    Nullop,
6812                    Nullop);
6813             LEAVE;
6814             if (!GvCVu(gv))
6815                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
6816                            sv);
6817         }
6818         return GvCVu(gv);
6819     }
6820 }
6821
6822 /*
6823 =for apidoc sv_true
6824
6825 Returns true if the SV has a true value by Perl's rules.
6826 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
6827 instead use an in-line version.
6828
6829 =cut
6830 */
6831
6832 I32
6833 Perl_sv_true(pTHX_ register SV *sv)
6834 {
6835     if (!sv)
6836         return 0;
6837     if (SvPOK(sv)) {
6838         register const XPV* const tXpv = (XPV*)SvANY(sv);
6839         if (tXpv &&
6840                 (tXpv->xpv_cur > 1 ||
6841                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
6842             return 1;
6843         else
6844             return 0;
6845     }
6846     else {
6847         if (SvIOK(sv))
6848             return SvIVX(sv) != 0;
6849         else {
6850             if (SvNOK(sv))
6851                 return SvNVX(sv) != 0.0;
6852             else
6853                 return sv_2bool(sv);
6854         }
6855     }
6856 }
6857
6858 /*
6859 =for apidoc sv_pvn_force
6860
6861 Get a sensible string out of the SV somehow.
6862 A private implementation of the C<SvPV_force> macro for compilers which
6863 can't cope with complex macro expressions. Always use the macro instead.
6864
6865 =for apidoc sv_pvn_force_flags
6866
6867 Get a sensible string out of the SV somehow.
6868 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
6869 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
6870 implemented in terms of this function.
6871 You normally want to use the various wrapper macros instead: see
6872 C<SvPV_force> and C<SvPV_force_nomg>
6873
6874 =cut
6875 */
6876
6877 char *
6878 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
6879 {
6880
6881     if (SvTHINKFIRST(sv) && !SvROK(sv))
6882         sv_force_normal_flags(sv, 0);
6883
6884     if (SvPOK(sv)) {
6885         if (lp)
6886             *lp = SvCUR(sv);
6887     }
6888     else {
6889         char *s;
6890         STRLEN len;
6891  
6892         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
6893             const char * const ref = sv_reftype(sv,0);
6894             if (PL_op)
6895                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
6896                            ref, OP_NAME(PL_op));
6897             else
6898                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
6899         }
6900         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
6901             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
6902                 OP_NAME(PL_op));
6903         s = sv_2pv_flags(sv, &len, flags);
6904         if (lp)
6905             *lp = len;
6906
6907         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
6908             if (SvROK(sv))
6909                 sv_unref(sv);
6910             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
6911             SvGROW(sv, len + 1);
6912             Move(s,SvPVX(sv),len,char);
6913             SvCUR_set(sv, len);
6914             *SvEND(sv) = '\0';
6915         }
6916         if (!SvPOK(sv)) {
6917             SvPOK_on(sv);               /* validate pointer */
6918             SvTAINT(sv);
6919             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
6920                                   PTR2UV(sv),SvPVX_const(sv)));
6921         }
6922     }
6923     return SvPVX_mutable(sv);
6924 }
6925
6926 /*
6927 =for apidoc sv_pvbyten_force
6928
6929 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
6930
6931 =cut
6932 */
6933
6934 char *
6935 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
6936 {
6937     sv_pvn_force(sv,lp);
6938     sv_utf8_downgrade(sv,0);
6939     *lp = SvCUR(sv);
6940     return SvPVX(sv);
6941 }
6942
6943 /*
6944 =for apidoc sv_pvutf8n_force
6945
6946 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
6947
6948 =cut
6949 */
6950
6951 char *
6952 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
6953 {
6954     sv_pvn_force(sv,lp);
6955     sv_utf8_upgrade(sv);
6956     *lp = SvCUR(sv);
6957     return SvPVX(sv);
6958 }
6959
6960 /*
6961 =for apidoc sv_reftype
6962
6963 Returns a string describing what the SV is a reference to.
6964
6965 =cut
6966 */
6967
6968 char *
6969 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
6970 {
6971     /* The fact that I don't need to downcast to char * everywhere, only in ?:
6972        inside return suggests a const propagation bug in g++.  */
6973     if (ob && SvOBJECT(sv)) {
6974         char * const name = HvNAME_get(SvSTASH(sv));
6975         return name ? name : (char *) "__ANON__";
6976     }
6977     else {
6978         switch (SvTYPE(sv)) {
6979         case SVt_NULL:
6980         case SVt_IV:
6981         case SVt_NV:
6982         case SVt_RV:
6983         case SVt_PV:
6984         case SVt_PVIV:
6985         case SVt_PVNV:
6986         case SVt_PVMG:
6987         case SVt_PVBM:
6988                                 if (SvVOK(sv))
6989                                     return "VSTRING";
6990                                 if (SvROK(sv))
6991                                     return "REF";
6992                                 else
6993                                     return "SCALAR";
6994
6995         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
6996                                 /* tied lvalues should appear to be
6997                                  * scalars for backwards compatitbility */
6998                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
6999                                     ? "SCALAR" : "LVALUE");
7000         case SVt_PVAV:          return "ARRAY";
7001         case SVt_PVHV:          return "HASH";
7002         case SVt_PVCV:          return "CODE";
7003         case SVt_PVGV:          return "GLOB";
7004         case SVt_PVFM:          return "FORMAT";
7005         case SVt_PVIO:          return "IO";
7006         default:                return "UNKNOWN";
7007         }
7008     }
7009 }
7010
7011 /*
7012 =for apidoc sv_isobject
7013
7014 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7015 object.  If the SV is not an RV, or if the object is not blessed, then this
7016 will return false.
7017
7018 =cut
7019 */
7020
7021 int
7022 Perl_sv_isobject(pTHX_ SV *sv)
7023 {
7024     if (!sv)
7025         return 0;
7026     SvGETMAGIC(sv);
7027     if (!SvROK(sv))
7028         return 0;
7029     sv = (SV*)SvRV(sv);
7030     if (!SvOBJECT(sv))
7031         return 0;
7032     return 1;
7033 }
7034
7035 /*
7036 =for apidoc sv_isa
7037
7038 Returns a boolean indicating whether the SV is blessed into the specified
7039 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7040 an inheritance relationship.
7041
7042 =cut
7043 */
7044
7045 int
7046 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7047 {
7048     const char *hvname;
7049     if (!sv)
7050         return 0;
7051     SvGETMAGIC(sv);
7052     if (!SvROK(sv))
7053         return 0;
7054     sv = (SV*)SvRV(sv);
7055     if (!SvOBJECT(sv))
7056         return 0;
7057     hvname = HvNAME_get(SvSTASH(sv));
7058     if (!hvname)
7059         return 0;
7060
7061     return strEQ(hvname, name);
7062 }
7063
7064 /*
7065 =for apidoc newSVrv
7066
7067 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7068 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7069 be blessed in the specified package.  The new SV is returned and its
7070 reference count is 1.
7071
7072 =cut
7073 */
7074
7075 SV*
7076 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7077 {
7078     SV *sv;
7079
7080     new_SV(sv);
7081
7082     SV_CHECK_THINKFIRST_COW_DROP(rv);
7083     SvAMAGIC_off(rv);
7084
7085     if (SvTYPE(rv) >= SVt_PVMG) {
7086         const U32 refcnt = SvREFCNT(rv);
7087         SvREFCNT(rv) = 0;
7088         sv_clear(rv);
7089         SvFLAGS(rv) = 0;
7090         SvREFCNT(rv) = refcnt;
7091     }
7092
7093     if (SvTYPE(rv) < SVt_RV)
7094         sv_upgrade(rv, SVt_RV);
7095     else if (SvTYPE(rv) > SVt_RV) {
7096         SvPV_free(rv);
7097         SvCUR_set(rv, 0);
7098         SvLEN_set(rv, 0);
7099     }
7100
7101     SvOK_off(rv);
7102     SvRV_set(rv, sv);
7103     SvROK_on(rv);
7104
7105     if (classname) {
7106         HV* const stash = gv_stashpv(classname, TRUE);
7107         (void)sv_bless(rv, stash);
7108     }
7109     return sv;
7110 }
7111
7112 /*
7113 =for apidoc sv_setref_pv
7114
7115 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7116 argument will be upgraded to an RV.  That RV will be modified to point to
7117 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7118 into the SV.  The C<classname> argument indicates the package for the
7119 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7120 will have a reference count of 1, and the RV will be returned.
7121
7122 Do not use with other Perl types such as HV, AV, SV, CV, because those
7123 objects will become corrupted by the pointer copy process.
7124
7125 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7126
7127 =cut
7128 */
7129
7130 SV*
7131 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7132 {
7133     if (!pv) {
7134         sv_setsv(rv, &PL_sv_undef);
7135         SvSETMAGIC(rv);
7136     }
7137     else
7138         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7139     return rv;
7140 }
7141
7142 /*
7143 =for apidoc sv_setref_iv
7144
7145 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7146 argument will be upgraded to an RV.  That RV will be modified to point to
7147 the new SV.  The C<classname> argument indicates the package for the
7148 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7149 will have a reference count of 1, and the RV will be returned.
7150
7151 =cut
7152 */
7153
7154 SV*
7155 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7156 {
7157     sv_setiv(newSVrv(rv,classname), iv);
7158     return rv;
7159 }
7160
7161 /*
7162 =for apidoc sv_setref_uv
7163
7164 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7165 argument will be upgraded to an RV.  That RV will be modified to point to
7166 the new SV.  The C<classname> argument indicates the package for the
7167 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7168 will have a reference count of 1, and the RV will be returned.
7169
7170 =cut
7171 */
7172
7173 SV*
7174 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7175 {
7176     sv_setuv(newSVrv(rv,classname), uv);
7177     return rv;
7178 }
7179
7180 /*
7181 =for apidoc sv_setref_nv
7182
7183 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7184 argument will be upgraded to an RV.  That RV will be modified to point to
7185 the new SV.  The C<classname> argument indicates the package for the
7186 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7187 will have a reference count of 1, and the RV will be returned.
7188
7189 =cut
7190 */
7191
7192 SV*
7193 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7194 {
7195     sv_setnv(newSVrv(rv,classname), nv);
7196     return rv;
7197 }
7198
7199 /*
7200 =for apidoc sv_setref_pvn
7201
7202 Copies a string into a new SV, optionally blessing the SV.  The length of the
7203 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7204 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7205 argument indicates the package for the blessing.  Set C<classname> to
7206 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7207 of 1, and the RV will be returned.
7208
7209 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7210
7211 =cut
7212 */
7213
7214 SV*
7215 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7216 {
7217     sv_setpvn(newSVrv(rv,classname), pv, n);
7218     return rv;
7219 }
7220
7221 /*
7222 =for apidoc sv_bless
7223
7224 Blesses an SV into a specified package.  The SV must be an RV.  The package
7225 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7226 of the SV is unaffected.
7227
7228 =cut
7229 */
7230
7231 SV*
7232 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7233 {
7234     SV *tmpRef;
7235     if (!SvROK(sv))
7236         Perl_croak(aTHX_ "Can't bless non-reference value");
7237     tmpRef = SvRV(sv);
7238     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7239         if (SvREADONLY(tmpRef))
7240             Perl_croak(aTHX_ PL_no_modify);
7241         if (SvOBJECT(tmpRef)) {
7242             if (SvTYPE(tmpRef) != SVt_PVIO)
7243                 --PL_sv_objcount;
7244             SvREFCNT_dec(SvSTASH(tmpRef));
7245         }
7246     }
7247     SvOBJECT_on(tmpRef);
7248     if (SvTYPE(tmpRef) != SVt_PVIO)
7249         ++PL_sv_objcount;
7250     SvUPGRADE(tmpRef, SVt_PVMG);
7251     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7252
7253     if (Gv_AMG(stash))
7254         SvAMAGIC_on(sv);
7255     else
7256         SvAMAGIC_off(sv);
7257
7258     if(SvSMAGICAL(tmpRef))
7259         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7260             mg_set(tmpRef);
7261
7262
7263
7264     return sv;
7265 }
7266
7267 /* Downgrades a PVGV to a PVMG.
7268  */
7269
7270 STATIC void
7271 S_sv_unglob(pTHX_ SV *sv)
7272 {
7273     void *xpvmg;
7274
7275     assert(SvTYPE(sv) == SVt_PVGV);
7276     SvFAKE_off(sv);
7277     if (GvGP(sv))
7278         gp_free((GV*)sv);
7279     if (GvSTASH(sv)) {
7280         sv_del_backref((SV*)GvSTASH(sv), sv);
7281         GvSTASH(sv) = Nullhv;
7282     }
7283     sv_unmagic(sv, PERL_MAGIC_glob);
7284     Safefree(GvNAME(sv));
7285     GvMULTI_off(sv);
7286
7287     /* need to keep SvANY(sv) in the right arena */
7288     xpvmg = new_XPVMG();
7289     StructCopy(SvANY(sv), xpvmg, XPVMG);
7290     del_XPVGV(SvANY(sv));
7291     SvANY(sv) = xpvmg;
7292
7293     SvFLAGS(sv) &= ~SVTYPEMASK;
7294     SvFLAGS(sv) |= SVt_PVMG;
7295 }
7296
7297 /*
7298 =for apidoc sv_unref_flags
7299
7300 Unsets the RV status of the SV, and decrements the reference count of
7301 whatever was being referenced by the RV.  This can almost be thought of
7302 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7303 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7304 (otherwise the decrementing is conditional on the reference count being
7305 different from one or the reference being a readonly SV).
7306 See C<SvROK_off>.
7307
7308 =cut
7309 */
7310
7311 void
7312 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7313 {
7314     SV* const target = SvRV(ref);
7315
7316     if (SvWEAKREF(ref)) {
7317         sv_del_backref(target, ref);
7318         SvWEAKREF_off(ref);
7319         SvRV_set(ref, NULL);
7320         return;
7321     }
7322     SvRV_set(ref, NULL);
7323     SvROK_off(ref);
7324     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7325        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7326     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7327         SvREFCNT_dec(target);
7328     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7329         sv_2mortal(target);     /* Schedule for freeing later */
7330 }
7331
7332 /*
7333 =for apidoc sv_untaint
7334
7335 Untaint an SV. Use C<SvTAINTED_off> instead.
7336 =cut
7337 */
7338
7339 void
7340 Perl_sv_untaint(pTHX_ SV *sv)
7341 {
7342     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7343         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7344         if (mg)
7345             mg->mg_len &= ~1;
7346     }
7347 }
7348
7349 /*
7350 =for apidoc sv_tainted
7351
7352 Test an SV for taintedness. Use C<SvTAINTED> instead.
7353 =cut
7354 */
7355
7356 bool
7357 Perl_sv_tainted(pTHX_ SV *sv)
7358 {
7359     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7360         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7361         if (mg && (mg->mg_len & 1) )
7362             return TRUE;
7363     }
7364     return FALSE;
7365 }
7366
7367 /*
7368 =for apidoc sv_setpviv
7369
7370 Copies an integer into the given SV, also updating its string value.
7371 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7372
7373 =cut
7374 */
7375
7376 void
7377 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7378 {
7379     char buf[TYPE_CHARS(UV)];
7380     char *ebuf;
7381     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7382
7383     sv_setpvn(sv, ptr, ebuf - ptr);
7384 }
7385
7386 /*
7387 =for apidoc sv_setpviv_mg
7388
7389 Like C<sv_setpviv>, but also handles 'set' magic.
7390
7391 =cut
7392 */
7393
7394 void
7395 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7396 {
7397     sv_setpviv(sv, iv);
7398     SvSETMAGIC(sv);
7399 }
7400
7401 #if defined(PERL_IMPLICIT_CONTEXT)
7402
7403 /* pTHX_ magic can't cope with varargs, so this is a no-context
7404  * version of the main function, (which may itself be aliased to us).
7405  * Don't access this version directly.
7406  */
7407
7408 void
7409 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7410 {
7411     dTHX;
7412     va_list args;
7413     va_start(args, pat);
7414     sv_vsetpvf(sv, pat, &args);
7415     va_end(args);
7416 }
7417
7418 /* pTHX_ magic can't cope with varargs, so this is a no-context
7419  * version of the main function, (which may itself be aliased to us).
7420  * Don't access this version directly.
7421  */
7422
7423 void
7424 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7425 {
7426     dTHX;
7427     va_list args;
7428     va_start(args, pat);
7429     sv_vsetpvf_mg(sv, pat, &args);
7430     va_end(args);
7431 }
7432 #endif
7433
7434 /*
7435 =for apidoc sv_setpvf
7436
7437 Works like C<sv_catpvf> but copies the text into the SV instead of
7438 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7439
7440 =cut
7441 */
7442
7443 void
7444 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7445 {
7446     va_list args;
7447     va_start(args, pat);
7448     sv_vsetpvf(sv, pat, &args);
7449     va_end(args);
7450 }
7451
7452 /*
7453 =for apidoc sv_vsetpvf
7454
7455 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7456 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7457
7458 Usually used via its frontend C<sv_setpvf>.
7459
7460 =cut
7461 */
7462
7463 void
7464 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7465 {
7466     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7467 }
7468
7469 /*
7470 =for apidoc sv_setpvf_mg
7471
7472 Like C<sv_setpvf>, but also handles 'set' magic.
7473
7474 =cut
7475 */
7476
7477 void
7478 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7479 {
7480     va_list args;
7481     va_start(args, pat);
7482     sv_vsetpvf_mg(sv, pat, &args);
7483     va_end(args);
7484 }
7485
7486 /*
7487 =for apidoc sv_vsetpvf_mg
7488
7489 Like C<sv_vsetpvf>, but also handles 'set' magic.
7490
7491 Usually used via its frontend C<sv_setpvf_mg>.
7492
7493 =cut
7494 */
7495
7496 void
7497 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7498 {
7499     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7500     SvSETMAGIC(sv);
7501 }
7502
7503 #if defined(PERL_IMPLICIT_CONTEXT)
7504
7505 /* pTHX_ magic can't cope with varargs, so this is a no-context
7506  * version of the main function, (which may itself be aliased to us).
7507  * Don't access this version directly.
7508  */
7509
7510 void
7511 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7512 {
7513     dTHX;
7514     va_list args;
7515     va_start(args, pat);
7516     sv_vcatpvf(sv, pat, &args);
7517     va_end(args);
7518 }
7519
7520 /* pTHX_ magic can't cope with varargs, so this is a no-context
7521  * version of the main function, (which may itself be aliased to us).
7522  * Don't access this version directly.
7523  */
7524
7525 void
7526 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7527 {
7528     dTHX;
7529     va_list args;
7530     va_start(args, pat);
7531     sv_vcatpvf_mg(sv, pat, &args);
7532     va_end(args);
7533 }
7534 #endif
7535
7536 /*
7537 =for apidoc sv_catpvf
7538
7539 Processes its arguments like C<sprintf> and appends the formatted
7540 output to an SV.  If the appended data contains "wide" characters
7541 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7542 and characters >255 formatted with %c), the original SV might get
7543 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7544 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7545 valid UTF-8; if the original SV was bytes, the pattern should be too.
7546
7547 =cut */
7548
7549 void
7550 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7551 {
7552     va_list args;
7553     va_start(args, pat);
7554     sv_vcatpvf(sv, pat, &args);
7555     va_end(args);
7556 }
7557
7558 /*
7559 =for apidoc sv_vcatpvf
7560
7561 Processes its arguments like C<vsprintf> and appends the formatted output
7562 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7563
7564 Usually used via its frontend C<sv_catpvf>.
7565
7566 =cut
7567 */
7568
7569 void
7570 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7571 {
7572     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7573 }
7574
7575 /*
7576 =for apidoc sv_catpvf_mg
7577
7578 Like C<sv_catpvf>, but also handles 'set' magic.
7579
7580 =cut
7581 */
7582
7583 void
7584 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7585 {
7586     va_list args;
7587     va_start(args, pat);
7588     sv_vcatpvf_mg(sv, pat, &args);
7589     va_end(args);
7590 }
7591
7592 /*
7593 =for apidoc sv_vcatpvf_mg
7594
7595 Like C<sv_vcatpvf>, but also handles 'set' magic.
7596
7597 Usually used via its frontend C<sv_catpvf_mg>.
7598
7599 =cut
7600 */
7601
7602 void
7603 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7604 {
7605     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7606     SvSETMAGIC(sv);
7607 }
7608
7609 /*
7610 =for apidoc sv_vsetpvfn
7611
7612 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7613 appending it.
7614
7615 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7616
7617 =cut
7618 */
7619
7620 void
7621 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7622 {
7623     sv_setpvn(sv, "", 0);
7624     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7625 }
7626
7627 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7628
7629 STATIC I32
7630 S_expect_number(pTHX_ char** pattern)
7631 {
7632     I32 var = 0;
7633     switch (**pattern) {
7634     case '1': case '2': case '3':
7635     case '4': case '5': case '6':
7636     case '7': case '8': case '9':
7637         var = *(*pattern)++ - '0';
7638         while (isDIGIT(**pattern)) {
7639             I32 tmp = var * 10 + (*(*pattern)++ - '0');
7640             if (tmp < var)
7641                 Perl_croak(aTHX_ "Integer overflow in format string for %s", (PL_op ? OP_NAME(PL_op) : "sv_vcatpvfn"));
7642             var = tmp;
7643         }
7644     }
7645     return var;
7646 }
7647 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7648
7649 static char *
7650 F0convert(NV nv, char *endbuf, STRLEN *len)
7651 {
7652     const int neg = nv < 0;
7653     UV uv;
7654
7655     if (neg)
7656         nv = -nv;
7657     if (nv < UV_MAX) {
7658         char *p = endbuf;
7659         nv += 0.5;
7660         uv = (UV)nv;
7661         if (uv & 1 && uv == nv)
7662             uv--;                       /* Round to even */
7663         do {
7664             const unsigned dig = uv % 10;
7665             *--p = '0' + dig;
7666         } while (uv /= 10);
7667         if (neg)
7668             *--p = '-';
7669         *len = endbuf - p;
7670         return p;
7671     }
7672     return Nullch;
7673 }
7674
7675
7676 /*
7677 =for apidoc sv_vcatpvfn
7678
7679 Processes its arguments like C<vsprintf> and appends the formatted output
7680 to an SV.  Uses an array of SVs if the C style variable argument list is
7681 missing (NULL).  When running with taint checks enabled, indicates via
7682 C<maybe_tainted> if results are untrustworthy (often due to the use of
7683 locales).
7684
7685 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7686
7687 =cut
7688 */
7689
7690
7691 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7692                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7693                         vec_utf8 = DO_UTF8(vecsv);
7694
7695 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7696
7697 void
7698 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7699 {
7700     char *p;
7701     char *q;
7702     const char *patend;
7703     STRLEN origlen;
7704     I32 svix = 0;
7705     static const char nullstr[] = "(null)";
7706     SV *argsv = Nullsv;
7707     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7708     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7709     SV *nsv = Nullsv;
7710     /* Times 4: a decimal digit takes more than 3 binary digits.
7711      * NV_DIG: mantissa takes than many decimal digits.
7712      * Plus 32: Playing safe. */
7713     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7714     /* large enough for "%#.#f" --chip */
7715     /* what about long double NVs? --jhi */
7716
7717     PERL_UNUSED_ARG(maybe_tainted);
7718
7719     /* no matter what, this is a string now */
7720     (void)SvPV_force(sv, origlen);
7721
7722     /* special-case "", "%s", and "%-p" (SVf - see below) */
7723     if (patlen == 0)
7724         return;
7725     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7726         if (args) {
7727             const char * const s = va_arg(*args, char*);
7728             sv_catpv(sv, s ? s : nullstr);
7729         }
7730         else if (svix < svmax) {
7731             sv_catsv(sv, *svargs);
7732         }
7733         return;
7734     }
7735     if (args && patlen == 3 && pat[0] == '%' &&
7736                 pat[1] == '-' && pat[2] == 'p') {
7737         argsv = va_arg(*args, SV*);
7738         sv_catsv(sv, argsv);
7739         return;
7740     }
7741
7742 #ifndef USE_LONG_DOUBLE
7743     /* special-case "%.<number>[gf]" */
7744     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7745          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7746         unsigned digits = 0;
7747         const char *pp;
7748
7749         pp = pat + 2;
7750         while (*pp >= '0' && *pp <= '9')
7751             digits = 10 * digits + (*pp++ - '0');
7752         if (pp - pat == (int)patlen - 1) {
7753             NV nv;
7754
7755             if (svix < svmax)
7756                 nv = SvNV(*svargs);
7757             else
7758                 return;
7759             if (*pp == 'g') {
7760                 /* Add check for digits != 0 because it seems that some
7761                    gconverts are buggy in this case, and we don't yet have
7762                    a Configure test for this.  */
7763                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7764                      /* 0, point, slack */
7765                     Gconvert(nv, (int)digits, 0, ebuf);
7766                     sv_catpv(sv, ebuf);
7767                     if (*ebuf)  /* May return an empty string for digits==0 */
7768                         return;
7769                 }
7770             } else if (!digits) {
7771                 STRLEN l;
7772
7773                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7774                     sv_catpvn(sv, p, l);
7775                     return;
7776                 }
7777             }
7778         }
7779     }
7780 #endif /* !USE_LONG_DOUBLE */
7781
7782     if (!args && svix < svmax && DO_UTF8(*svargs))
7783         has_utf8 = TRUE;
7784
7785     patend = (char*)pat + patlen;
7786     for (p = (char*)pat; p < patend; p = q) {
7787         bool alt = FALSE;
7788         bool left = FALSE;
7789         bool vectorize = FALSE;
7790         bool vectorarg = FALSE;
7791         bool vec_utf8 = FALSE;
7792         char fill = ' ';
7793         char plus = 0;
7794         char intsize = 0;
7795         STRLEN width = 0;
7796         STRLEN zeros = 0;
7797         bool has_precis = FALSE;
7798         STRLEN precis = 0;
7799         I32 osvix = svix;
7800         bool is_utf8 = FALSE;  /* is this item utf8?   */
7801 #ifdef HAS_LDBL_SPRINTF_BUG
7802         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
7803            with sfio - Allen <allens@cpan.org> */
7804         bool fix_ldbl_sprintf_bug = FALSE;
7805 #endif
7806
7807         char esignbuf[4];
7808         U8 utf8buf[UTF8_MAXBYTES+1];
7809         STRLEN esignlen = 0;
7810
7811         const char *eptr = Nullch;
7812         STRLEN elen = 0;
7813         SV *vecsv = Nullsv;
7814         const U8 *vecstr = Null(U8*);
7815         STRLEN veclen = 0;
7816         char c = 0;
7817         int i;
7818         unsigned base = 0;
7819         IV iv = 0;
7820         UV uv = 0;
7821         /* we need a long double target in case HAS_LONG_DOUBLE but
7822            not USE_LONG_DOUBLE
7823         */
7824 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
7825         long double nv;
7826 #else
7827         NV nv;
7828 #endif
7829         STRLEN have;
7830         STRLEN need;
7831         STRLEN gap;
7832         const char *dotstr = ".";
7833         STRLEN dotstrlen = 1;
7834         I32 efix = 0; /* explicit format parameter index */
7835         I32 ewix = 0; /* explicit width index */
7836         I32 epix = 0; /* explicit precision index */
7837         I32 evix = 0; /* explicit vector index */
7838         bool asterisk = FALSE;
7839
7840         /* echo everything up to the next format specification */
7841         for (q = p; q < patend && *q != '%'; ++q) ;
7842         if (q > p) {
7843             if (has_utf8 && !pat_utf8)
7844                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
7845             else
7846                 sv_catpvn(sv, p, q - p);
7847             p = q;
7848         }
7849         if (q++ >= patend)
7850             break;
7851
7852 /*
7853     We allow format specification elements in this order:
7854         \d+\$              explicit format parameter index
7855         [-+ 0#]+           flags
7856         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
7857         0                  flag (as above): repeated to allow "v02"     
7858         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
7859         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
7860         [hlqLV]            size
7861     [%bcdefginopsuxDFOUX] format (mandatory)
7862 */
7863
7864         if (args) {
7865 /*  
7866         As of perl5.9.3, printf format checking is on by default.
7867         Internally, perl uses %p formats to provide an escape to
7868         some extended formatting.  This block deals with those
7869         extensions: if it does not match, (char*)q is reset and
7870         the normal format processing code is used.
7871
7872         Currently defined extensions are:
7873                 %p              include pointer address (standard)      
7874                 %-p     (SVf)   include an SV (previously %_)
7875                 %-<num>p        include an SV with precision <num>      
7876                 %1p     (VDf)   include a v-string (as %vd)
7877                 %<num>p         reserved for future extensions
7878
7879         Robin Barker 2005-07-14
7880 */
7881             char* r = q; 
7882             bool sv = FALSE;    
7883             STRLEN n = 0;
7884             if (*q == '-')
7885                 sv = *q++;
7886             EXPECT_NUMBER(q, n);
7887             if (*q++ == 'p') {
7888                 if (sv) {                       /* SVf */
7889                     if (n) {
7890                         precis = n;
7891                         has_precis = TRUE;
7892                     }
7893                     argsv = va_arg(*args, SV*);
7894                     eptr = SvPVx_const(argsv, elen);
7895                     if (DO_UTF8(argsv))
7896                         is_utf8 = TRUE;
7897                     goto string;
7898                 }
7899 #if vdNUMBER
7900                 else if (n == vdNUMBER) {       /* VDf */
7901                     vectorize = TRUE;
7902                     VECTORIZE_ARGS
7903                     goto format_vd;
7904                 }
7905 #endif
7906                 else if (n) {
7907                     if (ckWARN_d(WARN_INTERNAL))
7908                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
7909                         "internal %%<num>p might conflict with future printf extensions");
7910                 }
7911             }
7912             q = r; 
7913         }
7914
7915         if (EXPECT_NUMBER(q, width)) {
7916             if (*q == '$') {
7917                 ++q;
7918                 efix = width;
7919             } else {
7920                 goto gotwidth;
7921             }
7922         }
7923
7924         /* FLAGS */
7925
7926         while (*q) {
7927             switch (*q) {
7928             case ' ':
7929             case '+':
7930                 plus = *q++;
7931                 continue;
7932
7933             case '-':
7934                 left = TRUE;
7935                 q++;
7936                 continue;
7937
7938             case '0':
7939                 fill = *q++;
7940                 continue;
7941
7942             case '#':
7943                 alt = TRUE;
7944                 q++;
7945                 continue;
7946
7947             default:
7948                 break;
7949             }
7950             break;
7951         }
7952
7953       tryasterisk:
7954         if (*q == '*') {
7955             q++;
7956             if (EXPECT_NUMBER(q, ewix))
7957                 if (*q++ != '$')
7958                     goto unknown;
7959             asterisk = TRUE;
7960         }
7961         if (*q == 'v') {
7962             q++;
7963             if (vectorize)
7964                 goto unknown;
7965             if ((vectorarg = asterisk)) {
7966                 evix = ewix;
7967                 ewix = 0;
7968                 asterisk = FALSE;
7969             }
7970             vectorize = TRUE;
7971             goto tryasterisk;
7972         }
7973
7974         if (!asterisk)
7975         {
7976             if( *q == '0' )
7977                 fill = *q++;
7978             EXPECT_NUMBER(q, width);
7979         }
7980
7981         if (vectorize) {
7982             if (vectorarg) {
7983                 if (args)
7984                     vecsv = va_arg(*args, SV*);
7985                 else if (evix) {
7986                     vecsv = (evix > 0 && evix <= svmax)
7987                         ? svargs[evix-1] : &PL_sv_undef;
7988                 } else {
7989                     vecsv = svix < svmax ? svargs[svix++] : &PL_sv_undef;
7990                 }
7991                 dotstr = SvPV_const(vecsv, dotstrlen);
7992                 /* Keep the DO_UTF8 test *after* the SvPV call, else things go
7993                    bad with tied or overloaded values that return UTF8.  */
7994                 if (DO_UTF8(vecsv))
7995                     is_utf8 = TRUE;
7996                 else if (has_utf8) {
7997                     vecsv = sv_mortalcopy(vecsv);
7998                     sv_utf8_upgrade(vecsv);
7999                     dotstr = SvPV_const(vecsv, dotstrlen);
8000                     is_utf8 = TRUE;
8001                 }                   
8002             }
8003             if (args) {
8004                 VECTORIZE_ARGS
8005             }
8006             else if (efix ? (efix > 0 && efix <= svmax) : svix < svmax) {
8007                 vecsv = svargs[efix ? efix-1 : svix++];
8008                 vecstr = (U8*)SvPV_const(vecsv,veclen);
8009                 vec_utf8 = DO_UTF8(vecsv);
8010                 /* if this is a version object, we need to return the
8011                  * stringified representation (which the SvPVX_const has
8012                  * already done for us), but not vectorize the args
8013                  */
8014                 if ( *q == 'd' && sv_derived_from(vecsv,"version") )
8015                 {
8016                         q++; /* skip past the rest of the %vd format */
8017                         eptr = (const char *) vecstr;
8018                         elen = veclen;
8019                         if (elen && *eptr == 'v') {
8020                             eptr++;
8021                             elen--;
8022                         }
8023                         vectorize=FALSE;
8024                         goto string;
8025                 }
8026             }
8027             else {
8028                 vecstr = (U8*)"";
8029                 veclen = 0;
8030             }
8031         }
8032
8033         if (asterisk) {
8034             if (args)
8035                 i = va_arg(*args, int);
8036             else
8037                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8038                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8039             left |= (i < 0);
8040             width = (i < 0) ? -i : i;
8041         }
8042       gotwidth:
8043
8044         /* PRECISION */
8045
8046         if (*q == '.') {
8047             q++;
8048             if (*q == '*') {
8049                 q++;
8050                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8051                     goto unknown;
8052                 /* XXX: todo, support specified precision parameter */
8053                 if (epix)
8054                     goto unknown;
8055                 if (args)
8056                     i = va_arg(*args, int);
8057                 else
8058                     i = (ewix ? ewix <= svmax : svix < svmax)
8059                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8060                 precis = (i < 0) ? 0 : i;
8061             }
8062             else {
8063                 precis = 0;
8064                 while (isDIGIT(*q))
8065                     precis = precis * 10 + (*q++ - '0');
8066             }
8067             has_precis = TRUE;
8068         }
8069
8070         /* SIZE */
8071
8072         switch (*q) {
8073 #ifdef WIN32
8074         case 'I':                       /* Ix, I32x, and I64x */
8075 #  ifdef WIN64
8076             if (q[1] == '6' && q[2] == '4') {
8077                 q += 3;
8078                 intsize = 'q';
8079                 break;
8080             }
8081 #  endif
8082             if (q[1] == '3' && q[2] == '2') {
8083                 q += 3;
8084                 break;
8085             }
8086 #  ifdef WIN64
8087             intsize = 'q';
8088 #  endif
8089             q++;
8090             break;
8091 #endif
8092 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8093         case 'L':                       /* Ld */
8094             /* FALL THROUGH */
8095 #ifdef HAS_QUAD
8096         case 'q':                       /* qd */
8097 #endif
8098             intsize = 'q';
8099             q++;
8100             break;
8101 #endif
8102         case 'l':
8103 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8104             if (*(q + 1) == 'l') {      /* lld, llf */
8105                 intsize = 'q';
8106                 q += 2;
8107                 break;
8108              }
8109 #endif
8110             /* FALL THROUGH */
8111         case 'h':
8112             /* FALL THROUGH */
8113         case 'V':
8114             intsize = *q++;
8115             break;
8116         }
8117
8118         /* CONVERSION */
8119
8120         if (*q == '%') {
8121             eptr = q++;
8122             elen = 1;
8123             if (vectorize) {
8124                 c = '%';
8125                 goto unknown;
8126             }
8127             goto string;
8128         }
8129
8130         if (!vectorize && !args) {
8131             if (efix) {
8132                 const I32 i = efix-1;
8133                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8134             } else {
8135                 argsv = (svix >= 0 && svix < svmax)
8136                     ? svargs[svix++] : &PL_sv_undef;
8137             }
8138         }
8139
8140         switch (c = *q++) {
8141
8142             /* STRINGS */
8143
8144         case 'c':
8145             if (vectorize)
8146                 goto unknown;
8147             uv = (args) ? va_arg(*args, int) : SvIVx(argsv);
8148             if ((uv > 255 ||
8149                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8150                 && !IN_BYTES) {
8151                 eptr = (char*)utf8buf;
8152                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8153                 is_utf8 = TRUE;
8154             }
8155             else {
8156                 c = (char)uv;
8157                 eptr = &c;
8158                 elen = 1;
8159             }
8160             goto string;
8161
8162         case 's':
8163             if (vectorize)
8164                 goto unknown;
8165             if (args) {
8166                 eptr = va_arg(*args, char*);
8167                 if (eptr)
8168 #ifdef MACOS_TRADITIONAL
8169                   /* On MacOS, %#s format is used for Pascal strings */
8170                   if (alt)
8171                     elen = *eptr++;
8172                   else
8173 #endif
8174                     elen = strlen(eptr);
8175                 else {
8176                     eptr = (char *)nullstr;
8177                     elen = sizeof nullstr - 1;
8178                 }
8179             }
8180             else {
8181                 eptr = SvPVx_const(argsv, elen);
8182                 if (DO_UTF8(argsv)) {
8183                     if (has_precis && precis < elen) {
8184                         I32 p = precis;
8185                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8186                         precis = p;
8187                     }
8188                     if (width) { /* fudge width (can't fudge elen) */
8189                         width += elen - sv_len_utf8(argsv);
8190                     }
8191                     is_utf8 = TRUE;
8192                 }
8193             }
8194
8195         string:
8196             if (has_precis && elen > precis)
8197                 elen = precis;
8198             break;
8199
8200             /* INTEGERS */
8201
8202         case 'p':
8203             if (alt || vectorize)
8204                 goto unknown;
8205             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8206             base = 16;
8207             goto integer;
8208
8209         case 'D':
8210 #ifdef IV_IS_QUAD
8211             intsize = 'q';
8212 #else
8213             intsize = 'l';
8214 #endif
8215             /* FALL THROUGH */
8216         case 'd':
8217         case 'i':
8218 #if vdNUMBER
8219         format_vd:
8220 #endif
8221             if (vectorize) {
8222                 STRLEN ulen;
8223                 if (!veclen)
8224                     continue;
8225                 if (vec_utf8)
8226                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8227                                         UTF8_ALLOW_ANYUV);
8228                 else {
8229                     uv = *vecstr;
8230                     ulen = 1;
8231                 }
8232                 vecstr += ulen;
8233                 veclen -= ulen;
8234                 if (plus)
8235                      esignbuf[esignlen++] = plus;
8236             }
8237             else if (args) {
8238                 switch (intsize) {
8239                 case 'h':       iv = (short)va_arg(*args, int); break;
8240                 case 'l':       iv = va_arg(*args, long); break;
8241                 case 'V':       iv = va_arg(*args, IV); break;
8242                 default:        iv = va_arg(*args, int); break;
8243 #ifdef HAS_QUAD
8244                 case 'q':       iv = va_arg(*args, Quad_t); break;
8245 #endif
8246                 }
8247             }
8248             else {
8249                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8250                 switch (intsize) {
8251                 case 'h':       iv = (short)tiv; break;
8252                 case 'l':       iv = (long)tiv; break;
8253                 case 'V':
8254                 default:        iv = tiv; break;
8255 #ifdef HAS_QUAD
8256                 case 'q':       iv = (Quad_t)tiv; break;
8257 #endif
8258                 }
8259             }
8260             if ( !vectorize )   /* we already set uv above */
8261             {
8262                 if (iv >= 0) {
8263                     uv = iv;
8264                     if (plus)
8265                         esignbuf[esignlen++] = plus;
8266                 }
8267                 else {
8268                     uv = -iv;
8269                     esignbuf[esignlen++] = '-';
8270                 }
8271             }
8272             base = 10;
8273             goto integer;
8274
8275         case 'U':
8276 #ifdef IV_IS_QUAD
8277             intsize = 'q';
8278 #else
8279             intsize = 'l';
8280 #endif
8281             /* FALL THROUGH */
8282         case 'u':
8283             base = 10;
8284             goto uns_integer;
8285
8286         case 'b':
8287             base = 2;
8288             goto uns_integer;
8289
8290         case 'O':
8291 #ifdef IV_IS_QUAD
8292             intsize = 'q';
8293 #else
8294             intsize = 'l';
8295 #endif
8296             /* FALL THROUGH */
8297         case 'o':
8298             base = 8;
8299             goto uns_integer;
8300
8301         case 'X':
8302         case 'x':
8303             base = 16;
8304
8305         uns_integer:
8306             if (vectorize) {
8307                 STRLEN ulen;
8308         vector:
8309                 if (!veclen)
8310                     continue;
8311                 if (vec_utf8)
8312                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8313                                         UTF8_ALLOW_ANYUV);
8314                 else {
8315                     uv = *vecstr;
8316                     ulen = 1;
8317                 }
8318                 vecstr += ulen;
8319                 veclen -= ulen;
8320             }
8321             else if (args) {
8322                 switch (intsize) {
8323                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8324                 case 'l':  uv = va_arg(*args, unsigned long); break;
8325                 case 'V':  uv = va_arg(*args, UV); break;
8326                 default:   uv = va_arg(*args, unsigned); break;
8327 #ifdef HAS_QUAD
8328                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8329 #endif
8330                 }
8331             }
8332             else {
8333                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8334                 switch (intsize) {
8335                 case 'h':       uv = (unsigned short)tuv; break;
8336                 case 'l':       uv = (unsigned long)tuv; break;
8337                 case 'V':
8338                 default:        uv = tuv; break;
8339 #ifdef HAS_QUAD
8340                 case 'q':       uv = (Uquad_t)tuv; break;
8341 #endif
8342                 }
8343             }
8344
8345         integer:
8346             {
8347                 char *ptr = ebuf + sizeof ebuf;
8348                 switch (base) {
8349                     unsigned dig;
8350                 case 16:
8351                     if (!uv)
8352                         alt = FALSE;
8353                     p = (char*)((c == 'X')
8354                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8355                     do {
8356                         dig = uv & 15;
8357                         *--ptr = p[dig];
8358                     } while (uv >>= 4);
8359                     if (alt) {
8360                         esignbuf[esignlen++] = '0';
8361                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8362                     }
8363                     break;
8364                 case 8:
8365                     do {
8366                         dig = uv & 7;
8367                         *--ptr = '0' + dig;
8368                     } while (uv >>= 3);
8369                     if (alt && *ptr != '0')
8370                         *--ptr = '0';
8371                     break;
8372                 case 2:
8373                     if (!uv)
8374                         alt = FALSE;
8375                     do {
8376                         dig = uv & 1;
8377                         *--ptr = '0' + dig;
8378                     } while (uv >>= 1);
8379                     if (alt) {
8380                         esignbuf[esignlen++] = '0';
8381                         esignbuf[esignlen++] = 'b';
8382                     }
8383                     break;
8384                 default:                /* it had better be ten or less */
8385                     do {
8386                         dig = uv % base;
8387                         *--ptr = '0' + dig;
8388                     } while (uv /= base);
8389                     break;
8390                 }
8391                 elen = (ebuf + sizeof ebuf) - ptr;
8392                 eptr = ptr;
8393                 if (has_precis) {
8394                     if (precis > elen)
8395                         zeros = precis - elen;
8396                     else if (precis == 0 && elen == 1 && *eptr == '0')
8397                         elen = 0;
8398                 }
8399             }
8400             break;
8401
8402             /* FLOATING POINT */
8403
8404         case 'F':
8405             c = 'f';            /* maybe %F isn't supported here */
8406             /* FALL THROUGH */
8407         case 'e': case 'E':
8408         case 'f':
8409         case 'g': case 'G':
8410             if (vectorize)
8411                 goto unknown;
8412
8413             /* This is evil, but floating point is even more evil */
8414
8415             /* for SV-style calling, we can only get NV
8416                for C-style calling, we assume %f is double;
8417                for simplicity we allow any of %Lf, %llf, %qf for long double
8418             */
8419             switch (intsize) {
8420             case 'V':
8421 #if defined(USE_LONG_DOUBLE)
8422                 intsize = 'q';
8423 #endif
8424                 break;
8425 /* [perl #20339] - we should accept and ignore %lf rather than die */
8426             case 'l':
8427                 /* FALL THROUGH */
8428             default:
8429 #if defined(USE_LONG_DOUBLE)
8430                 intsize = args ? 0 : 'q';
8431 #endif
8432                 break;
8433             case 'q':
8434 #if defined(HAS_LONG_DOUBLE)
8435                 break;
8436 #else
8437                 /* FALL THROUGH */
8438 #endif
8439             case 'h':
8440                 goto unknown;
8441             }
8442
8443             /* now we need (long double) if intsize == 'q', else (double) */
8444             nv = (args) ?
8445 #if LONG_DOUBLESIZE > DOUBLESIZE
8446                 intsize == 'q' ?
8447                     va_arg(*args, long double) :
8448                     va_arg(*args, double)
8449 #else
8450                     va_arg(*args, double)
8451 #endif
8452                 : SvNVx(argsv);
8453
8454             need = 0;
8455             if (c != 'e' && c != 'E') {
8456                 i = PERL_INT_MIN;
8457                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8458                    will cast our (long double) to (double) */
8459                 (void)Perl_frexp(nv, &i);
8460                 if (i == PERL_INT_MIN)
8461                     Perl_die(aTHX_ "panic: frexp");
8462                 if (i > 0)
8463                     need = BIT_DIGITS(i);
8464             }
8465             need += has_precis ? precis : 6; /* known default */
8466
8467             if (need < width)
8468                 need = width;
8469
8470 #ifdef HAS_LDBL_SPRINTF_BUG
8471             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8472                with sfio - Allen <allens@cpan.org> */
8473
8474 #  ifdef DBL_MAX
8475 #    define MY_DBL_MAX DBL_MAX
8476 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8477 #    if DOUBLESIZE >= 8
8478 #      define MY_DBL_MAX 1.7976931348623157E+308L
8479 #    else
8480 #      define MY_DBL_MAX 3.40282347E+38L
8481 #    endif
8482 #  endif
8483
8484 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8485 #    define MY_DBL_MAX_BUG 1L
8486 #  else
8487 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8488 #  endif
8489
8490 #  ifdef DBL_MIN
8491 #    define MY_DBL_MIN DBL_MIN
8492 #  else  /* XXX guessing! -Allen */
8493 #    if DOUBLESIZE >= 8
8494 #      define MY_DBL_MIN 2.2250738585072014E-308L
8495 #    else
8496 #      define MY_DBL_MIN 1.17549435E-38L
8497 #    endif
8498 #  endif
8499
8500             if ((intsize == 'q') && (c == 'f') &&
8501                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8502                 (need < DBL_DIG)) {
8503                 /* it's going to be short enough that
8504                  * long double precision is not needed */
8505
8506                 if ((nv <= 0L) && (nv >= -0L))
8507                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8508                 else {
8509                     /* would use Perl_fp_class as a double-check but not
8510                      * functional on IRIX - see perl.h comments */
8511
8512                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8513                         /* It's within the range that a double can represent */
8514 #if defined(DBL_MAX) && !defined(DBL_MIN)
8515                         if ((nv >= ((long double)1/DBL_MAX)) ||
8516                             (nv <= (-(long double)1/DBL_MAX)))
8517 #endif
8518                         fix_ldbl_sprintf_bug = TRUE;
8519                     }
8520                 }
8521                 if (fix_ldbl_sprintf_bug == TRUE) {
8522                     double temp;
8523
8524                     intsize = 0;
8525                     temp = (double)nv;
8526                     nv = (NV)temp;
8527                 }
8528             }
8529
8530 #  undef MY_DBL_MAX
8531 #  undef MY_DBL_MAX_BUG
8532 #  undef MY_DBL_MIN
8533
8534 #endif /* HAS_LDBL_SPRINTF_BUG */
8535
8536             need += 20; /* fudge factor */
8537             if (PL_efloatsize < need) {
8538                 Safefree(PL_efloatbuf);
8539                 PL_efloatsize = need + 20; /* more fudge */
8540                 Newx(PL_efloatbuf, PL_efloatsize, char);
8541                 PL_efloatbuf[0] = '\0';
8542             }
8543
8544             if ( !(width || left || plus || alt) && fill != '0'
8545                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8546                 /* See earlier comment about buggy Gconvert when digits,
8547                    aka precis is 0  */
8548                 if ( c == 'g' && precis) {
8549                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8550                     /* May return an empty string for digits==0 */
8551                     if (*PL_efloatbuf) {
8552                         elen = strlen(PL_efloatbuf);
8553                         goto float_converted;
8554                     }
8555                 } else if ( c == 'f' && !precis) {
8556                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8557                         break;
8558                 }
8559             }
8560             {
8561                 char *ptr = ebuf + sizeof ebuf;
8562                 *--ptr = '\0';
8563                 *--ptr = c;
8564                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8565 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8566                 if (intsize == 'q') {
8567                     /* Copy the one or more characters in a long double
8568                      * format before the 'base' ([efgEFG]) character to
8569                      * the format string. */
8570                     static char const prifldbl[] = PERL_PRIfldbl;
8571                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8572                     while (p >= prifldbl) { *--ptr = *p--; }
8573                 }
8574 #endif
8575                 if (has_precis) {
8576                     base = precis;
8577                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8578                     *--ptr = '.';
8579                 }
8580                 if (width) {
8581                     base = width;
8582                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8583                 }
8584                 if (fill == '0')
8585                     *--ptr = fill;
8586                 if (left)
8587                     *--ptr = '-';
8588                 if (plus)
8589                     *--ptr = plus;
8590                 if (alt)
8591                     *--ptr = '#';
8592                 *--ptr = '%';
8593
8594                 /* No taint.  Otherwise we are in the strange situation
8595                  * where printf() taints but print($float) doesn't.
8596                  * --jhi */
8597 #if defined(HAS_LONG_DOUBLE)
8598                 elen = ((intsize == 'q')
8599                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8600                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8601 #else
8602                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8603 #endif
8604             }
8605         float_converted:
8606             eptr = PL_efloatbuf;
8607             break;
8608
8609             /* SPECIAL */
8610
8611         case 'n':
8612             if (vectorize)
8613                 goto unknown;
8614             i = SvCUR(sv) - origlen;
8615             if (args) {
8616                 switch (intsize) {
8617                 case 'h':       *(va_arg(*args, short*)) = i; break;
8618                 default:        *(va_arg(*args, int*)) = i; break;
8619                 case 'l':       *(va_arg(*args, long*)) = i; break;
8620                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8621 #ifdef HAS_QUAD
8622                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8623 #endif
8624                 }
8625             }
8626             else
8627                 sv_setuv_mg(argsv, (UV)i);
8628             continue;   /* not "break" */
8629
8630             /* UNKNOWN */
8631
8632         default:
8633       unknown:
8634             if (!args
8635                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8636                 && ckWARN(WARN_PRINTF))
8637             {
8638                 SV * const msg = sv_newmortal();
8639                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8640                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8641                 if (c) {
8642                     if (isPRINT(c))
8643                         Perl_sv_catpvf(aTHX_ msg,
8644                                        "\"%%%c\"", c & 0xFF);
8645                     else
8646                         Perl_sv_catpvf(aTHX_ msg,
8647                                        "\"%%\\%03"UVof"\"",
8648                                        (UV)c & 0xFF);
8649                 } else
8650                     sv_catpv(msg, "end of string");
8651                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8652             }
8653
8654             /* output mangled stuff ... */
8655             if (c == '\0')
8656                 --q;
8657             eptr = p;
8658             elen = q - p;
8659
8660             /* ... right here, because formatting flags should not apply */
8661             SvGROW(sv, SvCUR(sv) + elen + 1);
8662             p = SvEND(sv);
8663             Copy(eptr, p, elen, char);
8664             p += elen;
8665             *p = '\0';
8666             SvCUR_set(sv, p - SvPVX_const(sv));
8667             svix = osvix;
8668             continue;   /* not "break" */
8669         }
8670
8671         /* calculate width before utf8_upgrade changes it */
8672         have = esignlen + zeros + elen;
8673         if (have < zeros)
8674             Perl_croak_nocontext(PL_memory_wrap);
8675
8676         if (is_utf8 != has_utf8) {
8677              if (is_utf8) {
8678                   if (SvCUR(sv))
8679                        sv_utf8_upgrade(sv);
8680              }
8681              else {
8682                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8683                   sv_utf8_upgrade(nsv);
8684                   eptr = SvPVX_const(nsv);
8685                   elen = SvCUR(nsv);
8686              }
8687              SvGROW(sv, SvCUR(sv) + elen + 1);
8688              p = SvEND(sv);
8689              *p = '\0';
8690         }
8691
8692         need = (have > width ? have : width);
8693         gap = need - have;
8694
8695         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8696             Perl_croak_nocontext(PL_memory_wrap);
8697         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8698         p = SvEND(sv);
8699         if (esignlen && fill == '0') {
8700             int i;
8701             for (i = 0; i < (int)esignlen; i++)
8702                 *p++ = esignbuf[i];
8703         }
8704         if (gap && !left) {
8705             memset(p, fill, gap);
8706             p += gap;
8707         }
8708         if (esignlen && fill != '0') {
8709             int i;
8710             for (i = 0; i < (int)esignlen; i++)
8711                 *p++ = esignbuf[i];
8712         }
8713         if (zeros) {
8714             int i;
8715             for (i = zeros; i; i--)
8716                 *p++ = '0';
8717         }
8718         if (elen) {
8719             Copy(eptr, p, elen, char);
8720             p += elen;
8721         }
8722         if (gap && left) {
8723             memset(p, ' ', gap);
8724             p += gap;
8725         }
8726         if (vectorize) {
8727             if (veclen) {
8728                 Copy(dotstr, p, dotstrlen, char);
8729                 p += dotstrlen;
8730             }
8731             else
8732                 vectorize = FALSE;              /* done iterating over vecstr */
8733         }
8734         if (is_utf8)
8735             has_utf8 = TRUE;
8736         if (has_utf8)
8737             SvUTF8_on(sv);
8738         *p = '\0';
8739         SvCUR_set(sv, p - SvPVX_const(sv));
8740         if (vectorize) {
8741             esignlen = 0;
8742             goto vector;
8743         }
8744     }
8745 }
8746
8747 /* =========================================================================
8748
8749 =head1 Cloning an interpreter
8750
8751 All the macros and functions in this section are for the private use of
8752 the main function, perl_clone().
8753
8754 The foo_dup() functions make an exact copy of an existing foo thinngy.
8755 During the course of a cloning, a hash table is used to map old addresses
8756 to new addresses. The table is created and manipulated with the
8757 ptr_table_* functions.
8758
8759 =cut
8760
8761 ============================================================================*/
8762
8763
8764 #if defined(USE_ITHREADS)
8765
8766 #ifndef GpREFCNT_inc
8767 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8768 #endif
8769
8770
8771 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8772 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8773 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8774 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8775 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8776 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8777 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8778 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8779 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8780 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8781 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8782 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8783 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8784
8785
8786 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8787    regcomp.c. AMS 20010712 */
8788
8789 REGEXP *
8790 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8791 {
8792     dVAR;
8793     REGEXP *ret;
8794     int i, len, npar;
8795     struct reg_substr_datum *s;
8796
8797     if (!r)
8798         return (REGEXP *)NULL;
8799
8800     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8801         return ret;
8802
8803     len = r->offsets[0];
8804     npar = r->nparens+1;
8805
8806     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8807     Copy(r->program, ret->program, len+1, regnode);
8808
8809     Newx(ret->startp, npar, I32);
8810     Copy(r->startp, ret->startp, npar, I32);
8811     Newx(ret->endp, npar, I32);
8812     Copy(r->startp, ret->startp, npar, I32);
8813
8814     Newx(ret->substrs, 1, struct reg_substr_data);
8815     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
8816         s->min_offset = r->substrs->data[i].min_offset;
8817         s->max_offset = r->substrs->data[i].max_offset;
8818         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
8819         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
8820     }
8821
8822     ret->regstclass = NULL;
8823     if (r->data) {
8824         struct reg_data *d;
8825         const int count = r->data->count;
8826         int i;
8827
8828         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
8829                 char, struct reg_data);
8830         Newx(d->what, count, U8);
8831
8832         d->count = count;
8833         for (i = 0; i < count; i++) {
8834             d->what[i] = r->data->what[i];
8835             switch (d->what[i]) {
8836                 /* legal options are one of: sfpont
8837                    see also regcomp.h and pregfree() */
8838             case 's':
8839                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
8840                 break;
8841             case 'p':
8842                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
8843                 break;
8844             case 'f':
8845                 /* This is cheating. */
8846                 Newx(d->data[i], 1, struct regnode_charclass_class);
8847                 StructCopy(r->data->data[i], d->data[i],
8848                             struct regnode_charclass_class);
8849                 ret->regstclass = (regnode*)d->data[i];
8850                 break;
8851             case 'o':
8852                 /* Compiled op trees are readonly, and can thus be
8853                    shared without duplication. */
8854                 OP_REFCNT_LOCK;
8855                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
8856                 OP_REFCNT_UNLOCK;
8857                 break;
8858             case 'n':
8859                 d->data[i] = r->data->data[i];
8860                 break;
8861             case 't':
8862                 d->data[i] = r->data->data[i];
8863                 OP_REFCNT_LOCK;
8864                 ((reg_trie_data*)d->data[i])->refcount++;
8865                 OP_REFCNT_UNLOCK;
8866                 break;
8867             default:
8868                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
8869             }
8870         }
8871
8872         ret->data = d;
8873     }
8874     else
8875         ret->data = NULL;
8876
8877     Newx(ret->offsets, 2*len+1, U32);
8878     Copy(r->offsets, ret->offsets, 2*len+1, U32);
8879
8880     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
8881     ret->refcnt         = r->refcnt;
8882     ret->minlen         = r->minlen;
8883     ret->prelen         = r->prelen;
8884     ret->nparens        = r->nparens;
8885     ret->lastparen      = r->lastparen;
8886     ret->lastcloseparen = r->lastcloseparen;
8887     ret->reganch        = r->reganch;
8888
8889     ret->sublen         = r->sublen;
8890
8891     if (RX_MATCH_COPIED(ret))
8892         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
8893     else
8894         ret->subbeg = Nullch;
8895 #ifdef PERL_OLD_COPY_ON_WRITE
8896     ret->saved_copy = Nullsv;
8897 #endif
8898
8899     ptr_table_store(PL_ptr_table, r, ret);
8900     return ret;
8901 }
8902
8903 /* duplicate a file handle */
8904
8905 PerlIO *
8906 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
8907 {
8908     PerlIO *ret;
8909
8910     PERL_UNUSED_ARG(type);
8911
8912     if (!fp)
8913         return (PerlIO*)NULL;
8914
8915     /* look for it in the table first */
8916     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
8917     if (ret)
8918         return ret;
8919
8920     /* create anew and remember what it is */
8921     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
8922     ptr_table_store(PL_ptr_table, fp, ret);
8923     return ret;
8924 }
8925
8926 /* duplicate a directory handle */
8927
8928 DIR *
8929 Perl_dirp_dup(pTHX_ DIR *dp)
8930 {
8931     if (!dp)
8932         return (DIR*)NULL;
8933     /* XXX TODO */
8934     return dp;
8935 }
8936
8937 /* duplicate a typeglob */
8938
8939 GP *
8940 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
8941 {
8942     GP *ret;
8943     if (!gp)
8944         return (GP*)NULL;
8945     /* look for it in the table first */
8946     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
8947     if (ret)
8948         return ret;
8949
8950     /* create anew and remember what it is */
8951     Newxz(ret, 1, GP);
8952     ptr_table_store(PL_ptr_table, gp, ret);
8953
8954     /* clone */
8955     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
8956     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
8957     ret->gp_io          = io_dup_inc(gp->gp_io, param);
8958     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
8959     ret->gp_av          = av_dup_inc(gp->gp_av, param);
8960     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
8961     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
8962     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
8963     ret->gp_cvgen       = gp->gp_cvgen;
8964     ret->gp_line        = gp->gp_line;
8965     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
8966     return ret;
8967 }
8968
8969 /* duplicate a chain of magic */
8970
8971 MAGIC *
8972 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
8973 {
8974     MAGIC *mgprev = (MAGIC*)NULL;
8975     MAGIC *mgret;
8976     if (!mg)
8977         return (MAGIC*)NULL;
8978     /* look for it in the table first */
8979     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
8980     if (mgret)
8981         return mgret;
8982
8983     for (; mg; mg = mg->mg_moremagic) {
8984         MAGIC *nmg;
8985         Newxz(nmg, 1, MAGIC);
8986         if (mgprev)
8987             mgprev->mg_moremagic = nmg;
8988         else
8989             mgret = nmg;
8990         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
8991         nmg->mg_private = mg->mg_private;
8992         nmg->mg_type    = mg->mg_type;
8993         nmg->mg_flags   = mg->mg_flags;
8994         if (mg->mg_type == PERL_MAGIC_qr) {
8995             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
8996         }
8997         else if(mg->mg_type == PERL_MAGIC_backref) {
8998             const AV * const av = (AV*) mg->mg_obj;
8999             SV **svp;
9000             I32 i;
9001             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
9002             svp = AvARRAY(av);
9003             for (i = AvFILLp(av); i >= 0; i--) {
9004                 if (!svp[i]) continue;
9005                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
9006             }
9007         }
9008         else if (mg->mg_type == PERL_MAGIC_symtab) {
9009             nmg->mg_obj = mg->mg_obj;
9010         }
9011         else {
9012             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
9013                               ? sv_dup_inc(mg->mg_obj, param)
9014                               : sv_dup(mg->mg_obj, param);
9015         }
9016         nmg->mg_len     = mg->mg_len;
9017         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
9018         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
9019             if (mg->mg_len > 0) {
9020                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
9021                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9022                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9023                 {
9024                     AMT * const amtp = (AMT*)mg->mg_ptr;
9025                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9026                     I32 i;
9027                     for (i = 1; i < NofAMmeth; i++) {
9028                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9029                     }
9030                 }
9031             }
9032             else if (mg->mg_len == HEf_SVKEY)
9033                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9034         }
9035         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9036             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9037         }
9038         mgprev = nmg;
9039     }
9040     return mgret;
9041 }
9042
9043 /* create a new pointer-mapping table */
9044
9045 PTR_TBL_t *
9046 Perl_ptr_table_new(pTHX)
9047 {
9048     PTR_TBL_t *tbl;
9049     Newxz(tbl, 1, PTR_TBL_t);
9050     tbl->tbl_max        = 511;
9051     tbl->tbl_items      = 0;
9052     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9053     return tbl;
9054 }
9055
9056 #define PTR_TABLE_HASH(ptr) \
9057   ((PTR2UV(ptr) >> 3) ^ (PTR2UV(ptr) >> (3 + 7)) ^ (PTR2UV(ptr) >> (3 + 17)))
9058
9059 /* 
9060    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9061    following define) and at call to new_body_inline made below in 
9062    Perl_ptr_table_store()
9063  */
9064
9065 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9066
9067 /* map an existing pointer using a table */
9068
9069 STATIC PTR_TBL_ENT_t *
9070 S_ptr_table_find(pTHX_ PTR_TBL_t *tbl, const void *sv) {
9071     PTR_TBL_ENT_t *tblent;
9072     const UV hash = PTR_TABLE_HASH(sv);
9073     assert(tbl);
9074     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9075     for (; tblent; tblent = tblent->next) {
9076         if (tblent->oldval == sv)
9077             return tblent;
9078     }
9079     return 0;
9080 }
9081
9082 void *
9083 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9084 {
9085     PTR_TBL_ENT_t const *const tblent = S_ptr_table_find(aTHX_ tbl, sv);
9086     return tblent ? tblent->newval : (void *) 0;
9087 }
9088
9089 /* add a new entry to a pointer-mapping table */
9090
9091 void
9092 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9093 {
9094     PTR_TBL_ENT_t *tblent = S_ptr_table_find(aTHX_ tbl, oldsv);
9095
9096     if (tblent) {
9097         tblent->newval = newsv;
9098     } else {
9099         const UV entry = PTR_TABLE_HASH(oldsv) & tbl->tbl_max;
9100
9101         new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9102         tblent->oldval = oldsv;
9103         tblent->newval = newsv;
9104         tblent->next = tbl->tbl_ary[entry];
9105         tbl->tbl_ary[entry] = tblent;
9106         tbl->tbl_items++;
9107         if (tblent->next && tbl->tbl_items > tbl->tbl_max)
9108             ptr_table_split(tbl);
9109     }
9110 }
9111
9112 /* double the hash bucket size of an existing ptr table */
9113
9114 void
9115 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9116 {
9117     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9118     const UV oldsize = tbl->tbl_max + 1;
9119     UV newsize = oldsize * 2;
9120     UV i;
9121
9122     Renew(ary, newsize, PTR_TBL_ENT_t*);
9123     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9124     tbl->tbl_max = --newsize;
9125     tbl->tbl_ary = ary;
9126     for (i=0; i < oldsize; i++, ary++) {
9127         PTR_TBL_ENT_t **curentp, **entp, *ent;
9128         if (!*ary)
9129             continue;
9130         curentp = ary + oldsize;
9131         for (entp = ary, ent = *ary; ent; ent = *entp) {
9132             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9133                 *entp = ent->next;
9134                 ent->next = *curentp;
9135                 *curentp = ent;
9136                 continue;
9137             }
9138             else
9139                 entp = &ent->next;
9140         }
9141     }
9142 }
9143
9144 /* remove all the entries from a ptr table */
9145
9146 void
9147 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9148 {
9149     if (tbl && tbl->tbl_items) {
9150         register PTR_TBL_ENT_t **array = tbl->tbl_ary;
9151         UV riter = tbl->tbl_max;
9152
9153         do {
9154             PTR_TBL_ENT_t *entry = array[riter];
9155
9156             while (entry) {
9157                 PTR_TBL_ENT_t * const oentry = entry;
9158                 entry = entry->next;
9159                 del_pte(oentry);
9160             }
9161         } while (riter--);
9162
9163         tbl->tbl_items = 0;
9164     }
9165 }
9166
9167 /* clear and free a ptr table */
9168
9169 void
9170 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9171 {
9172     if (!tbl) {
9173         return;
9174     }
9175     ptr_table_clear(tbl);
9176     Safefree(tbl->tbl_ary);
9177     Safefree(tbl);
9178 }
9179
9180
9181 void
9182 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9183 {
9184     if (SvROK(sstr)) {
9185         SvRV_set(dstr, SvWEAKREF(sstr)
9186                        ? sv_dup(SvRV(sstr), param)
9187                        : sv_dup_inc(SvRV(sstr), param));
9188
9189     }
9190     else if (SvPVX_const(sstr)) {
9191         /* Has something there */
9192         if (SvLEN(sstr)) {
9193             /* Normal PV - clone whole allocated space */
9194             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9195             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9196                 /* Not that normal - actually sstr is copy on write.
9197                    But we are a true, independant SV, so:  */
9198                 SvREADONLY_off(dstr);
9199                 SvFAKE_off(dstr);
9200             }
9201         }
9202         else {
9203             /* Special case - not normally malloced for some reason */
9204             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9205                 /* A "shared" PV - clone it as "shared" PV */
9206                 SvPV_set(dstr,
9207                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9208                                          param)));
9209             }
9210             else {
9211                 /* Some other special case - random pointer */
9212                 SvPV_set(dstr, SvPVX(sstr));            
9213             }
9214         }
9215     }
9216     else {
9217         /* Copy the Null */
9218         if (SvTYPE(dstr) == SVt_RV)
9219             SvRV_set(dstr, NULL);
9220         else
9221             SvPV_set(dstr, 0);
9222     }
9223 }
9224
9225 /* duplicate an SV of any type (including AV, HV etc) */
9226
9227 SV *
9228 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9229 {
9230     dVAR;
9231     SV *dstr;
9232
9233     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9234         return Nullsv;
9235     /* look for it in the table first */
9236     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9237     if (dstr)
9238         return dstr;
9239
9240     if(param->flags & CLONEf_JOIN_IN) {
9241         /** We are joining here so we don't want do clone
9242             something that is bad **/
9243         const char *hvname;
9244
9245         if(SvTYPE(sstr) == SVt_PVHV &&
9246            (hvname = HvNAME_get(sstr))) {
9247             /** don't clone stashes if they already exist **/
9248             return (SV*)gv_stashpv(hvname,0);
9249         }
9250     }
9251
9252     /* create anew and remember what it is */
9253     new_SV(dstr);
9254
9255 #ifdef DEBUG_LEAKING_SCALARS
9256     dstr->sv_debug_optype = sstr->sv_debug_optype;
9257     dstr->sv_debug_line = sstr->sv_debug_line;
9258     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9259     dstr->sv_debug_cloned = 1;
9260 #  ifdef NETWARE
9261     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9262 #  else
9263     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9264 #  endif
9265 #endif
9266
9267     ptr_table_store(PL_ptr_table, sstr, dstr);
9268
9269     /* clone */
9270     SvFLAGS(dstr)       = SvFLAGS(sstr);
9271     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9272     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9273
9274 #ifdef DEBUGGING
9275     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9276         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9277                       PL_watch_pvx, SvPVX_const(sstr));
9278 #endif
9279
9280     /* don't clone objects whose class has asked us not to */
9281     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9282         SvFLAGS(dstr) &= ~SVTYPEMASK;
9283         SvOBJECT_off(dstr);
9284         return dstr;
9285     }
9286
9287     switch (SvTYPE(sstr)) {
9288     case SVt_NULL:
9289         SvANY(dstr)     = NULL;
9290         break;
9291     case SVt_IV:
9292         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9293         SvIV_set(dstr, SvIVX(sstr));
9294         break;
9295     case SVt_NV:
9296         SvANY(dstr)     = new_XNV();
9297         SvNV_set(dstr, SvNVX(sstr));
9298         break;
9299     case SVt_RV:
9300         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9301         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9302         break;
9303     default:
9304         {
9305             /* These are all the types that need complex bodies allocating.  */
9306             void *new_body;
9307             const svtype sv_type = SvTYPE(sstr);
9308             const struct body_details *const sv_type_details
9309                 = bodies_by_type + sv_type;
9310
9311             switch (sv_type) {
9312             default:
9313                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9314                            (IV)SvTYPE(sstr));
9315                 break;
9316
9317             case SVt_PVGV:
9318                 if (GvUNIQUE((GV*)sstr)) {
9319                     /* Do sharing here, and fall through */
9320                 }
9321             case SVt_PVIO:
9322             case SVt_PVFM:
9323             case SVt_PVHV:
9324             case SVt_PVAV:
9325             case SVt_PVBM:
9326             case SVt_PVCV:
9327             case SVt_PVLV:
9328             case SVt_PVMG:
9329             case SVt_PVNV:
9330             case SVt_PVIV:
9331             case SVt_PV:
9332                 assert(sv_type_details->copy);
9333                 if (sv_type_details->arena) {
9334                     new_body_inline(new_body, sv_type_details->copy, sv_type);
9335                     new_body
9336                         = (void*)((char*)new_body - sv_type_details->offset);
9337                 } else {
9338                     new_body = new_NOARENA(sv_type_details);
9339                 }
9340             }
9341             assert(new_body);
9342             SvANY(dstr) = new_body;
9343
9344 #ifndef PURIFY
9345             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9346                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9347                  sv_type_details->copy, char);
9348 #else
9349             Copy(((char*)SvANY(sstr)),
9350                  ((char*)SvANY(dstr)),
9351                  sv_type_details->size + sv_type_details->offset, char);
9352 #endif
9353
9354             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9355                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9356
9357             /* The Copy above means that all the source (unduplicated) pointers
9358                are now in the destination.  We can check the flags and the
9359                pointers in either, but it's possible that there's less cache
9360                missing by always going for the destination.
9361                FIXME - instrument and check that assumption  */
9362             if (sv_type >= SVt_PVMG) {
9363                 if (SvMAGIC(dstr))
9364                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9365                 if (SvSTASH(dstr))
9366                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9367             }
9368
9369             /* The cast silences a GCC warning about unhandled types.  */
9370             switch ((int)sv_type) {
9371             case SVt_PV:
9372                 break;
9373             case SVt_PVIV:
9374                 break;
9375             case SVt_PVNV:
9376                 break;
9377             case SVt_PVMG:
9378                 break;
9379             case SVt_PVBM:
9380                 break;
9381             case SVt_PVLV:
9382                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9383                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9384                     LvTARG(dstr) = dstr;
9385                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9386                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9387                 else
9388                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9389                 break;
9390             case SVt_PVGV:
9391                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9392                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9393                 /* Don't call sv_add_backref here as it's going to be created
9394                    as part of the magic cloning of the symbol table.  */
9395                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9396                 (void)GpREFCNT_inc(GvGP(dstr));
9397                 break;
9398             case SVt_PVIO:
9399                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9400                 if (IoOFP(dstr) == IoIFP(sstr))
9401                     IoOFP(dstr) = IoIFP(dstr);
9402                 else
9403                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9404                 /* PL_rsfp_filters entries have fake IoDIRP() */
9405                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9406                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9407                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9408                     /* I have no idea why fake dirp (rsfps)
9409                        should be treated differently but otherwise
9410                        we end up with leaks -- sky*/
9411                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9412                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9413                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9414                 } else {
9415                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9416                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9417                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9418                 }
9419                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9420                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9421                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9422                 break;
9423             case SVt_PVAV:
9424                 if (AvARRAY((AV*)sstr)) {
9425                     SV **dst_ary, **src_ary;
9426                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9427
9428                     src_ary = AvARRAY((AV*)sstr);
9429                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9430                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9431                     SvPV_set(dstr, (char*)dst_ary);
9432                     AvALLOC((AV*)dstr) = dst_ary;
9433                     if (AvREAL((AV*)sstr)) {
9434                         while (items-- > 0)
9435                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9436                     }
9437                     else {
9438                         while (items-- > 0)
9439                             *dst_ary++ = sv_dup(*src_ary++, param);
9440                     }
9441                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9442                     while (items-- > 0) {
9443                         *dst_ary++ = &PL_sv_undef;
9444                     }
9445                 }
9446                 else {
9447                     SvPV_set(dstr, Nullch);
9448                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9449                 }
9450                 break;
9451             case SVt_PVHV:
9452                 {
9453                     HEK *hvname = 0;
9454
9455                     if (HvARRAY((HV*)sstr)) {
9456                         STRLEN i = 0;
9457                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9458                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9459                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9460                         char *darray;
9461                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9462                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9463                             char);
9464                         HvARRAY(dstr) = (HE**)darray;
9465                         while (i <= sxhv->xhv_max) {
9466                             const HE *source = HvARRAY(sstr)[i];
9467                             HvARRAY(dstr)[i] = source
9468                                 ? he_dup(source, sharekeys, param) : 0;
9469                             ++i;
9470                         }
9471                         if (SvOOK(sstr)) {
9472                             struct xpvhv_aux * const saux = HvAUX(sstr);
9473                             struct xpvhv_aux * const daux = HvAUX(dstr);
9474                             /* This flag isn't copied.  */
9475                             /* SvOOK_on(hv) attacks the IV flags.  */
9476                             SvFLAGS(dstr) |= SVf_OOK;
9477
9478                             hvname = saux->xhv_name;
9479                             daux->xhv_name
9480                                 = hvname ? hek_dup(hvname, param) : hvname;
9481
9482                             daux->xhv_riter = saux->xhv_riter;
9483                             daux->xhv_eiter = saux->xhv_eiter
9484                                 ? he_dup(saux->xhv_eiter,
9485                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9486                         }
9487                     }
9488                     else {
9489                         SvPV_set(dstr, Nullch);
9490                     }
9491                     /* Record stashes for possible cloning in Perl_clone(). */
9492                     if(hvname)
9493                         av_push(param->stashes, dstr);
9494                 }
9495                 break;
9496             case SVt_PVFM:
9497             case SVt_PVCV:
9498                 /* NOTE: not refcounted */
9499                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9500                 OP_REFCNT_LOCK;
9501                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9502                 OP_REFCNT_UNLOCK;
9503                 if (CvCONST(dstr)) {
9504                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9505                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9506                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9507                 }
9508                 /* don't dup if copying back - CvGV isn't refcounted, so the
9509                  * duped GV may never be freed. A bit of a hack! DAPM */
9510                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9511                     Nullgv : gv_dup(CvGV(dstr), param) ;
9512                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9513                     CvDEPTH(dstr) = 0;
9514                 }
9515                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9516                 CvOUTSIDE(dstr) =
9517                     CvWEAKOUTSIDE(sstr)
9518                     ? cv_dup(    CvOUTSIDE(dstr), param)
9519                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9520                 if (!CvXSUB(dstr))
9521                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9522                 break;
9523             }
9524         }
9525     }
9526
9527     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9528         ++PL_sv_objcount;
9529
9530     return dstr;
9531  }
9532
9533 /* duplicate a context */
9534
9535 PERL_CONTEXT *
9536 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9537 {
9538     PERL_CONTEXT *ncxs;
9539
9540     if (!cxs)
9541         return (PERL_CONTEXT*)NULL;
9542
9543     /* look for it in the table first */
9544     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9545     if (ncxs)
9546         return ncxs;
9547
9548     /* create anew and remember what it is */
9549     Newxz(ncxs, max + 1, PERL_CONTEXT);
9550     ptr_table_store(PL_ptr_table, cxs, ncxs);
9551
9552     while (ix >= 0) {
9553         PERL_CONTEXT *cx = &cxs[ix];
9554         PERL_CONTEXT *ncx = &ncxs[ix];
9555         ncx->cx_type    = cx->cx_type;
9556         if (CxTYPE(cx) == CXt_SUBST) {
9557             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9558         }
9559         else {
9560             ncx->blk_oldsp      = cx->blk_oldsp;
9561             ncx->blk_oldcop     = cx->blk_oldcop;
9562             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9563             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9564             ncx->blk_oldpm      = cx->blk_oldpm;
9565             ncx->blk_gimme      = cx->blk_gimme;
9566             switch (CxTYPE(cx)) {
9567             case CXt_SUB:
9568                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9569                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9570                                            : cv_dup(cx->blk_sub.cv,param));
9571                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9572                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9573                                            : Nullav);
9574                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9575                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9576                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9577                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9578                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9579                 break;
9580             case CXt_EVAL:
9581                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9582                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9583                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9584                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9585                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9586                 ncx->blk_eval.retop = cx->blk_eval.retop;
9587                 break;
9588             case CXt_LOOP:
9589                 ncx->blk_loop.label     = cx->blk_loop.label;
9590                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9591                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9592                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9593                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9594                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9595                                            ? cx->blk_loop.iterdata
9596                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9597                 ncx->blk_loop.oldcomppad
9598                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9599                                             cx->blk_loop.oldcomppad);
9600                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9601                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9602                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9603                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9604                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9605                 break;
9606             case CXt_FORMAT:
9607                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9608                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9609                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9610                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9611                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9612                 break;
9613             case CXt_BLOCK:
9614             case CXt_NULL:
9615                 break;
9616             }
9617         }
9618         --ix;
9619     }
9620     return ncxs;
9621 }
9622
9623 /* duplicate a stack info structure */
9624
9625 PERL_SI *
9626 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9627 {
9628     PERL_SI *nsi;
9629
9630     if (!si)
9631         return (PERL_SI*)NULL;
9632
9633     /* look for it in the table first */
9634     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9635     if (nsi)
9636         return nsi;
9637
9638     /* create anew and remember what it is */
9639     Newxz(nsi, 1, PERL_SI);
9640     ptr_table_store(PL_ptr_table, si, nsi);
9641
9642     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9643     nsi->si_cxix        = si->si_cxix;
9644     nsi->si_cxmax       = si->si_cxmax;
9645     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9646     nsi->si_type        = si->si_type;
9647     nsi->si_prev        = si_dup(si->si_prev, param);
9648     nsi->si_next        = si_dup(si->si_next, param);
9649     nsi->si_markoff     = si->si_markoff;
9650
9651     return nsi;
9652 }
9653
9654 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9655 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9656 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9657 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9658 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9659 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9660 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9661 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9662 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9663 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9664 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9665 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9666 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9667 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9668
9669 /* XXXXX todo */
9670 #define pv_dup_inc(p)   SAVEPV(p)
9671 #define pv_dup(p)       SAVEPV(p)
9672 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9673
9674 /* map any object to the new equivent - either something in the
9675  * ptr table, or something in the interpreter structure
9676  */
9677
9678 void *
9679 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9680 {
9681     void *ret;
9682
9683     if (!v)
9684         return (void*)NULL;
9685
9686     /* look for it in the table first */
9687     ret = ptr_table_fetch(PL_ptr_table, v);
9688     if (ret)
9689         return ret;
9690
9691     /* see if it is part of the interpreter structure */
9692     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9693         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9694     else {
9695         ret = v;
9696     }
9697
9698     return ret;
9699 }
9700
9701 /* duplicate the save stack */
9702
9703 ANY *
9704 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9705 {
9706     ANY * const ss      = proto_perl->Tsavestack;
9707     const I32 max       = proto_perl->Tsavestack_max;
9708     I32 ix              = proto_perl->Tsavestack_ix;
9709     ANY *nss;
9710     SV *sv;
9711     GV *gv;
9712     AV *av;
9713     HV *hv;
9714     void* ptr;
9715     int intval;
9716     long longval;
9717     GP *gp;
9718     IV iv;
9719     char *c = NULL;
9720     void (*dptr) (void*);
9721     void (*dxptr) (pTHX_ void*);
9722
9723     Newxz(nss, max, ANY);
9724
9725     while (ix > 0) {
9726         I32 i = POPINT(ss,ix);
9727         TOPINT(nss,ix) = i;
9728         switch (i) {
9729         case SAVEt_ITEM:                        /* normal string */
9730             sv = (SV*)POPPTR(ss,ix);
9731             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9732             sv = (SV*)POPPTR(ss,ix);
9733             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9734             break;
9735         case SAVEt_SV:                          /* scalar reference */
9736             sv = (SV*)POPPTR(ss,ix);
9737             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9738             gv = (GV*)POPPTR(ss,ix);
9739             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9740             break;
9741         case SAVEt_GENERIC_PVREF:               /* generic char* */
9742             c = (char*)POPPTR(ss,ix);
9743             TOPPTR(nss,ix) = pv_dup(c);
9744             ptr = POPPTR(ss,ix);
9745             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9746             break;
9747         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9748             c = (char*)POPPTR(ss,ix);
9749             TOPPTR(nss,ix) = savesharedpv(c);
9750             ptr = POPPTR(ss,ix);
9751             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9752             break;
9753         case SAVEt_GENERIC_SVREF:               /* generic sv */
9754         case SAVEt_SVREF:                       /* scalar reference */
9755             sv = (SV*)POPPTR(ss,ix);
9756             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9757             ptr = POPPTR(ss,ix);
9758             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9759             break;
9760         case SAVEt_AV:                          /* array reference */
9761             av = (AV*)POPPTR(ss,ix);
9762             TOPPTR(nss,ix) = av_dup_inc(av, param);
9763             gv = (GV*)POPPTR(ss,ix);
9764             TOPPTR(nss,ix) = gv_dup(gv, param);
9765             break;
9766         case SAVEt_HV:                          /* hash reference */
9767             hv = (HV*)POPPTR(ss,ix);
9768             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9769             gv = (GV*)POPPTR(ss,ix);
9770             TOPPTR(nss,ix) = gv_dup(gv, param);
9771             break;
9772         case SAVEt_INT:                         /* int reference */
9773             ptr = POPPTR(ss,ix);
9774             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9775             intval = (int)POPINT(ss,ix);
9776             TOPINT(nss,ix) = intval;
9777             break;
9778         case SAVEt_LONG:                        /* long reference */
9779             ptr = POPPTR(ss,ix);
9780             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9781             longval = (long)POPLONG(ss,ix);
9782             TOPLONG(nss,ix) = longval;
9783             break;
9784         case SAVEt_I32:                         /* I32 reference */
9785         case SAVEt_I16:                         /* I16 reference */
9786         case SAVEt_I8:                          /* I8 reference */
9787             ptr = POPPTR(ss,ix);
9788             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9789             i = POPINT(ss,ix);
9790             TOPINT(nss,ix) = i;
9791             break;
9792         case SAVEt_IV:                          /* IV reference */
9793             ptr = POPPTR(ss,ix);
9794             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9795             iv = POPIV(ss,ix);
9796             TOPIV(nss,ix) = iv;
9797             break;
9798         case SAVEt_SPTR:                        /* SV* reference */
9799             ptr = POPPTR(ss,ix);
9800             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9801             sv = (SV*)POPPTR(ss,ix);
9802             TOPPTR(nss,ix) = sv_dup(sv, param);
9803             break;
9804         case SAVEt_VPTR:                        /* random* reference */
9805             ptr = POPPTR(ss,ix);
9806             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9807             ptr = POPPTR(ss,ix);
9808             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9809             break;
9810         case SAVEt_PPTR:                        /* char* reference */
9811             ptr = POPPTR(ss,ix);
9812             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9813             c = (char*)POPPTR(ss,ix);
9814             TOPPTR(nss,ix) = pv_dup(c);
9815             break;
9816         case SAVEt_HPTR:                        /* HV* reference */
9817             ptr = POPPTR(ss,ix);
9818             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9819             hv = (HV*)POPPTR(ss,ix);
9820             TOPPTR(nss,ix) = hv_dup(hv, param);
9821             break;
9822         case SAVEt_APTR:                        /* AV* reference */
9823             ptr = POPPTR(ss,ix);
9824             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9825             av = (AV*)POPPTR(ss,ix);
9826             TOPPTR(nss,ix) = av_dup(av, param);
9827             break;
9828         case SAVEt_NSTAB:
9829             gv = (GV*)POPPTR(ss,ix);
9830             TOPPTR(nss,ix) = gv_dup(gv, param);
9831             break;
9832         case SAVEt_GP:                          /* scalar reference */
9833             gp = (GP*)POPPTR(ss,ix);
9834             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
9835             (void)GpREFCNT_inc(gp);
9836             gv = (GV*)POPPTR(ss,ix);
9837             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9838             c = (char*)POPPTR(ss,ix);
9839             TOPPTR(nss,ix) = pv_dup(c);
9840             iv = POPIV(ss,ix);
9841             TOPIV(nss,ix) = iv;
9842             iv = POPIV(ss,ix);
9843             TOPIV(nss,ix) = iv;
9844             break;
9845         case SAVEt_FREESV:
9846         case SAVEt_MORTALIZESV:
9847             sv = (SV*)POPPTR(ss,ix);
9848             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9849             break;
9850         case SAVEt_FREEOP:
9851             ptr = POPPTR(ss,ix);
9852             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
9853                 /* these are assumed to be refcounted properly */
9854                 OP *o;
9855                 switch (((OP*)ptr)->op_type) {
9856                 case OP_LEAVESUB:
9857                 case OP_LEAVESUBLV:
9858                 case OP_LEAVEEVAL:
9859                 case OP_LEAVE:
9860                 case OP_SCOPE:
9861                 case OP_LEAVEWRITE:
9862                     TOPPTR(nss,ix) = ptr;
9863                     o = (OP*)ptr;
9864                     OpREFCNT_inc(o);
9865                     break;
9866                 default:
9867                     TOPPTR(nss,ix) = Nullop;
9868                     break;
9869                 }
9870             }
9871             else
9872                 TOPPTR(nss,ix) = Nullop;
9873             break;
9874         case SAVEt_FREEPV:
9875             c = (char*)POPPTR(ss,ix);
9876             TOPPTR(nss,ix) = pv_dup_inc(c);
9877             break;
9878         case SAVEt_CLEARSV:
9879             longval = POPLONG(ss,ix);
9880             TOPLONG(nss,ix) = longval;
9881             break;
9882         case SAVEt_DELETE:
9883             hv = (HV*)POPPTR(ss,ix);
9884             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9885             c = (char*)POPPTR(ss,ix);
9886             TOPPTR(nss,ix) = pv_dup_inc(c);
9887             i = POPINT(ss,ix);
9888             TOPINT(nss,ix) = i;
9889             break;
9890         case SAVEt_DESTRUCTOR:
9891             ptr = POPPTR(ss,ix);
9892             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9893             dptr = POPDPTR(ss,ix);
9894             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
9895                                         any_dup(FPTR2DPTR(void *, dptr),
9896                                                 proto_perl));
9897             break;
9898         case SAVEt_DESTRUCTOR_X:
9899             ptr = POPPTR(ss,ix);
9900             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9901             dxptr = POPDXPTR(ss,ix);
9902             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
9903                                          any_dup(FPTR2DPTR(void *, dxptr),
9904                                                  proto_perl));
9905             break;
9906         case SAVEt_REGCONTEXT:
9907         case SAVEt_ALLOC:
9908             i = POPINT(ss,ix);
9909             TOPINT(nss,ix) = i;
9910             ix -= i;
9911             break;
9912         case SAVEt_STACK_POS:           /* Position on Perl stack */
9913             i = POPINT(ss,ix);
9914             TOPINT(nss,ix) = i;
9915             break;
9916         case SAVEt_AELEM:               /* array element */
9917             sv = (SV*)POPPTR(ss,ix);
9918             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9919             i = POPINT(ss,ix);
9920             TOPINT(nss,ix) = i;
9921             av = (AV*)POPPTR(ss,ix);
9922             TOPPTR(nss,ix) = av_dup_inc(av, param);
9923             break;
9924         case SAVEt_HELEM:               /* hash element */
9925             sv = (SV*)POPPTR(ss,ix);
9926             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9927             sv = (SV*)POPPTR(ss,ix);
9928             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9929             hv = (HV*)POPPTR(ss,ix);
9930             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9931             break;
9932         case SAVEt_OP:
9933             ptr = POPPTR(ss,ix);
9934             TOPPTR(nss,ix) = ptr;
9935             break;
9936         case SAVEt_HINTS:
9937             i = POPINT(ss,ix);
9938             TOPINT(nss,ix) = i;
9939             break;
9940         case SAVEt_COMPPAD:
9941             av = (AV*)POPPTR(ss,ix);
9942             TOPPTR(nss,ix) = av_dup(av, param);
9943             break;
9944         case SAVEt_PADSV:
9945             longval = (long)POPLONG(ss,ix);
9946             TOPLONG(nss,ix) = longval;
9947             ptr = POPPTR(ss,ix);
9948             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9949             sv = (SV*)POPPTR(ss,ix);
9950             TOPPTR(nss,ix) = sv_dup(sv, param);
9951             break;
9952         case SAVEt_BOOL:
9953             ptr = POPPTR(ss,ix);
9954             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9955             longval = (long)POPBOOL(ss,ix);
9956             TOPBOOL(nss,ix) = (bool)longval;
9957             break;
9958         case SAVEt_SET_SVFLAGS:
9959             i = POPINT(ss,ix);
9960             TOPINT(nss,ix) = i;
9961             i = POPINT(ss,ix);
9962             TOPINT(nss,ix) = i;
9963             sv = (SV*)POPPTR(ss,ix);
9964             TOPPTR(nss,ix) = sv_dup(sv, param);
9965             break;
9966         default:
9967             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
9968         }
9969     }
9970
9971     return nss;
9972 }
9973
9974
9975 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
9976  * flag to the result. This is done for each stash before cloning starts,
9977  * so we know which stashes want their objects cloned */
9978
9979 static void
9980 do_mark_cloneable_stash(pTHX_ SV *sv)
9981 {
9982     const HEK * const hvname = HvNAME_HEK((HV*)sv);
9983     if (hvname) {
9984         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
9985         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
9986         if (cloner && GvCV(cloner)) {
9987             dSP;
9988             UV status;
9989
9990             ENTER;
9991             SAVETMPS;
9992             PUSHMARK(SP);
9993             XPUSHs(sv_2mortal(newSVhek(hvname)));
9994             PUTBACK;
9995             call_sv((SV*)GvCV(cloner), G_SCALAR);
9996             SPAGAIN;
9997             status = POPu;
9998             PUTBACK;
9999             FREETMPS;
10000             LEAVE;
10001             if (status)
10002                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
10003         }
10004     }
10005 }
10006
10007
10008
10009 /*
10010 =for apidoc perl_clone
10011
10012 Create and return a new interpreter by cloning the current one.
10013
10014 perl_clone takes these flags as parameters:
10015
10016 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10017 without it we only clone the data and zero the stacks,
10018 with it we copy the stacks and the new perl interpreter is
10019 ready to run at the exact same point as the previous one.
10020 The pseudo-fork code uses COPY_STACKS while the
10021 threads->new doesn't.
10022
10023 CLONEf_KEEP_PTR_TABLE
10024 perl_clone keeps a ptr_table with the pointer of the old
10025 variable as a key and the new variable as a value,
10026 this allows it to check if something has been cloned and not
10027 clone it again but rather just use the value and increase the
10028 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10029 the ptr_table using the function
10030 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10031 reason to keep it around is if you want to dup some of your own
10032 variable who are outside the graph perl scans, example of this
10033 code is in threads.xs create
10034
10035 CLONEf_CLONE_HOST
10036 This is a win32 thing, it is ignored on unix, it tells perls
10037 win32host code (which is c++) to clone itself, this is needed on
10038 win32 if you want to run two threads at the same time,
10039 if you just want to do some stuff in a separate perl interpreter
10040 and then throw it away and return to the original one,
10041 you don't need to do anything.
10042
10043 =cut
10044 */
10045
10046 /* XXX the above needs expanding by someone who actually understands it ! */
10047 EXTERN_C PerlInterpreter *
10048 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10049
10050 PerlInterpreter *
10051 perl_clone(PerlInterpreter *proto_perl, UV flags)
10052 {
10053    dVAR;
10054 #ifdef PERL_IMPLICIT_SYS
10055
10056    /* perlhost.h so we need to call into it
10057    to clone the host, CPerlHost should have a c interface, sky */
10058
10059    if (flags & CLONEf_CLONE_HOST) {
10060        return perl_clone_host(proto_perl,flags);
10061    }
10062    return perl_clone_using(proto_perl, flags,
10063                             proto_perl->IMem,
10064                             proto_perl->IMemShared,
10065                             proto_perl->IMemParse,
10066                             proto_perl->IEnv,
10067                             proto_perl->IStdIO,
10068                             proto_perl->ILIO,
10069                             proto_perl->IDir,
10070                             proto_perl->ISock,
10071                             proto_perl->IProc);
10072 }
10073
10074 PerlInterpreter *
10075 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10076                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10077                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10078                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10079                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10080                  struct IPerlProc* ipP)
10081 {
10082     /* XXX many of the string copies here can be optimized if they're
10083      * constants; they need to be allocated as common memory and just
10084      * their pointers copied. */
10085
10086     IV i;
10087     CLONE_PARAMS clone_params;
10088     CLONE_PARAMS* param = &clone_params;
10089
10090     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10091     /* for each stash, determine whether its objects should be cloned */
10092     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10093     PERL_SET_THX(my_perl);
10094
10095 #  ifdef DEBUGGING
10096     Poison(my_perl, 1, PerlInterpreter);
10097     PL_op = Nullop;
10098     PL_curcop = (COP *)Nullop;
10099     PL_markstack = 0;
10100     PL_scopestack = 0;
10101     PL_savestack = 0;
10102     PL_savestack_ix = 0;
10103     PL_savestack_max = -1;
10104     PL_sig_pending = 0;
10105     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10106 #  else /* !DEBUGGING */
10107     Zero(my_perl, 1, PerlInterpreter);
10108 #  endif        /* DEBUGGING */
10109
10110     /* host pointers */
10111     PL_Mem              = ipM;
10112     PL_MemShared        = ipMS;
10113     PL_MemParse         = ipMP;
10114     PL_Env              = ipE;
10115     PL_StdIO            = ipStd;
10116     PL_LIO              = ipLIO;
10117     PL_Dir              = ipD;
10118     PL_Sock             = ipS;
10119     PL_Proc             = ipP;
10120 #else           /* !PERL_IMPLICIT_SYS */
10121     IV i;
10122     CLONE_PARAMS clone_params;
10123     CLONE_PARAMS* param = &clone_params;
10124     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10125     /* for each stash, determine whether its objects should be cloned */
10126     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10127     PERL_SET_THX(my_perl);
10128
10129 #    ifdef DEBUGGING
10130     Poison(my_perl, 1, PerlInterpreter);
10131     PL_op = Nullop;
10132     PL_curcop = (COP *)Nullop;
10133     PL_markstack = 0;
10134     PL_scopestack = 0;
10135     PL_savestack = 0;
10136     PL_savestack_ix = 0;
10137     PL_savestack_max = -1;
10138     PL_sig_pending = 0;
10139     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10140 #    else       /* !DEBUGGING */
10141     Zero(my_perl, 1, PerlInterpreter);
10142 #    endif      /* DEBUGGING */
10143 #endif          /* PERL_IMPLICIT_SYS */
10144     param->flags = flags;
10145     param->proto_perl = proto_perl;
10146
10147     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10148     Zero(&PL_body_roots, 1, PL_body_roots);
10149     
10150     PL_nice_chunk       = NULL;
10151     PL_nice_chunk_size  = 0;
10152     PL_sv_count         = 0;
10153     PL_sv_objcount      = 0;
10154     PL_sv_root          = Nullsv;
10155     PL_sv_arenaroot     = Nullsv;
10156
10157     PL_debug            = proto_perl->Idebug;
10158
10159     PL_hash_seed        = proto_perl->Ihash_seed;
10160     PL_rehash_seed      = proto_perl->Irehash_seed;
10161
10162 #ifdef USE_REENTRANT_API
10163     /* XXX: things like -Dm will segfault here in perlio, but doing
10164      *  PERL_SET_CONTEXT(proto_perl);
10165      * breaks too many other things
10166      */
10167     Perl_reentrant_init(aTHX);
10168 #endif
10169
10170     /* create SV map for pointer relocation */
10171     PL_ptr_table = ptr_table_new();
10172
10173     /* initialize these special pointers as early as possible */
10174     SvANY(&PL_sv_undef)         = NULL;
10175     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10176     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10177     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10178
10179     SvANY(&PL_sv_no)            = new_XPVNV();
10180     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10181     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10182                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10183     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10184     SvCUR_set(&PL_sv_no, 0);
10185     SvLEN_set(&PL_sv_no, 1);
10186     SvIV_set(&PL_sv_no, 0);
10187     SvNV_set(&PL_sv_no, 0);
10188     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10189
10190     SvANY(&PL_sv_yes)           = new_XPVNV();
10191     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10192     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10193                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10194     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10195     SvCUR_set(&PL_sv_yes, 1);
10196     SvLEN_set(&PL_sv_yes, 2);
10197     SvIV_set(&PL_sv_yes, 1);
10198     SvNV_set(&PL_sv_yes, 1);
10199     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10200
10201     /* create (a non-shared!) shared string table */
10202     PL_strtab           = newHV();
10203     HvSHAREKEYS_off(PL_strtab);
10204     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10205     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10206
10207     PL_compiling = proto_perl->Icompiling;
10208
10209     /* These two PVs will be free'd special way so must set them same way op.c does */
10210     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10211     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10212
10213     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10214     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10215
10216     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10217     if (!specialWARN(PL_compiling.cop_warnings))
10218         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10219     if (!specialCopIO(PL_compiling.cop_io))
10220         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10221     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10222
10223     /* pseudo environmental stuff */
10224     PL_origargc         = proto_perl->Iorigargc;
10225     PL_origargv         = proto_perl->Iorigargv;
10226
10227     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10228
10229     /* Set tainting stuff before PerlIO_debug can possibly get called */
10230     PL_tainting         = proto_perl->Itainting;
10231     PL_taint_warn       = proto_perl->Itaint_warn;
10232
10233 #ifdef PERLIO_LAYERS
10234     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10235     PerlIO_clone(aTHX_ proto_perl, param);
10236 #endif
10237
10238     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10239     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10240     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10241     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10242     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10243     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10244
10245     /* switches */
10246     PL_minus_c          = proto_perl->Iminus_c;
10247     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10248     PL_localpatches     = proto_perl->Ilocalpatches;
10249     PL_splitstr         = proto_perl->Isplitstr;
10250     PL_preprocess       = proto_perl->Ipreprocess;
10251     PL_minus_n          = proto_perl->Iminus_n;
10252     PL_minus_p          = proto_perl->Iminus_p;
10253     PL_minus_l          = proto_perl->Iminus_l;
10254     PL_minus_a          = proto_perl->Iminus_a;
10255     PL_minus_F          = proto_perl->Iminus_F;
10256     PL_doswitches       = proto_perl->Idoswitches;
10257     PL_dowarn           = proto_perl->Idowarn;
10258     PL_doextract        = proto_perl->Idoextract;
10259     PL_sawampersand     = proto_perl->Isawampersand;
10260     PL_unsafe           = proto_perl->Iunsafe;
10261     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10262     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10263     PL_perldb           = proto_perl->Iperldb;
10264     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10265     PL_exit_flags       = proto_perl->Iexit_flags;
10266
10267     /* magical thingies */
10268     /* XXX time(&PL_basetime) when asked for? */
10269     PL_basetime         = proto_perl->Ibasetime;
10270     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10271
10272     PL_maxsysfd         = proto_perl->Imaxsysfd;
10273     PL_multiline        = proto_perl->Imultiline;
10274     PL_statusvalue      = proto_perl->Istatusvalue;
10275 #ifdef VMS
10276     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10277 #else
10278     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10279 #endif
10280     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10281
10282     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10283     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10284     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10285
10286     /* Clone the regex array */
10287     PL_regex_padav = newAV();
10288     {
10289         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10290         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10291         IV i;
10292         av_push(PL_regex_padav,
10293                 sv_dup_inc(regexen[0],param));
10294         for(i = 1; i <= len; i++) {
10295             if(SvREPADTMP(regexen[i])) {
10296               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10297             } else {
10298                 av_push(PL_regex_padav,
10299                     SvREFCNT_inc(
10300                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10301                              SvIVX(regexen[i])), param)))
10302                        ));
10303             }
10304         }
10305     }
10306     PL_regex_pad = AvARRAY(PL_regex_padav);
10307
10308     /* shortcuts to various I/O objects */
10309     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10310     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10311     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10312     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10313     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10314     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10315
10316     /* shortcuts to regexp stuff */
10317     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10318
10319     /* shortcuts to misc objects */
10320     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10321
10322     /* shortcuts to debugging objects */
10323     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10324     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10325     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10326     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10327     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10328     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10329     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10330     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10331     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10332
10333     /* symbol tables */
10334     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10335     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10336     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10337     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10338     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10339
10340     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10341     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10342     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10343     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10344     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10345     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10346
10347     PL_sub_generation   = proto_perl->Isub_generation;
10348
10349     /* funky return mechanisms */
10350     PL_forkprocess      = proto_perl->Iforkprocess;
10351
10352     /* subprocess state */
10353     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10354
10355     /* internal state */
10356     PL_maxo             = proto_perl->Imaxo;
10357     if (proto_perl->Iop_mask)
10358         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10359     else
10360         PL_op_mask      = Nullch;
10361     /* PL_asserting        = proto_perl->Iasserting; */
10362
10363     /* current interpreter roots */
10364     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10365     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10366     PL_main_start       = proto_perl->Imain_start;
10367     PL_eval_root        = proto_perl->Ieval_root;
10368     PL_eval_start       = proto_perl->Ieval_start;
10369
10370     /* runtime control stuff */
10371     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10372     PL_copline          = proto_perl->Icopline;
10373
10374     PL_filemode         = proto_perl->Ifilemode;
10375     PL_lastfd           = proto_perl->Ilastfd;
10376     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10377     PL_Argv             = NULL;
10378     PL_Cmd              = Nullch;
10379     PL_gensym           = proto_perl->Igensym;
10380     PL_preambled        = proto_perl->Ipreambled;
10381     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10382     PL_laststatval      = proto_perl->Ilaststatval;
10383     PL_laststype        = proto_perl->Ilaststype;
10384     PL_mess_sv          = Nullsv;
10385
10386     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10387
10388     /* interpreter atexit processing */
10389     PL_exitlistlen      = proto_perl->Iexitlistlen;
10390     if (PL_exitlistlen) {
10391         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10392         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10393     }
10394     else
10395         PL_exitlist     = (PerlExitListEntry*)NULL;
10396     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10397     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10398     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10399
10400     PL_profiledata      = NULL;
10401     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10402     /* PL_rsfp_filters entries have fake IoDIRP() */
10403     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10404
10405     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10406
10407     PAD_CLONE_VARS(proto_perl, param);
10408
10409 #ifdef HAVE_INTERP_INTERN
10410     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10411 #endif
10412
10413     /* more statics moved here */
10414     PL_generation       = proto_perl->Igeneration;
10415     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10416
10417     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10418     PL_in_clean_all     = proto_perl->Iin_clean_all;
10419
10420     PL_uid              = proto_perl->Iuid;
10421     PL_euid             = proto_perl->Ieuid;
10422     PL_gid              = proto_perl->Igid;
10423     PL_egid             = proto_perl->Iegid;
10424     PL_nomemok          = proto_perl->Inomemok;
10425     PL_an               = proto_perl->Ian;
10426     PL_evalseq          = proto_perl->Ievalseq;
10427     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10428     PL_origalen         = proto_perl->Iorigalen;
10429 #ifdef PERL_USES_PL_PIDSTATUS
10430     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10431 #endif
10432     PL_osname           = SAVEPV(proto_perl->Iosname);
10433     PL_sighandlerp      = proto_perl->Isighandlerp;
10434
10435     PL_runops           = proto_perl->Irunops;
10436
10437     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10438
10439 #ifdef CSH
10440     PL_cshlen           = proto_perl->Icshlen;
10441     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10442 #endif
10443
10444     PL_lex_state        = proto_perl->Ilex_state;
10445     PL_lex_defer        = proto_perl->Ilex_defer;
10446     PL_lex_expect       = proto_perl->Ilex_expect;
10447     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10448     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10449     PL_lex_starts       = proto_perl->Ilex_starts;
10450     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10451     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10452     PL_lex_op           = proto_perl->Ilex_op;
10453     PL_lex_inpat        = proto_perl->Ilex_inpat;
10454     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10455     PL_lex_brackets     = proto_perl->Ilex_brackets;
10456     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10457     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10458     PL_lex_casemods     = proto_perl->Ilex_casemods;
10459     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10460     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10461
10462     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10463     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10464     PL_nexttoke         = proto_perl->Inexttoke;
10465
10466     /* XXX This is probably masking the deeper issue of why
10467      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10468      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10469      * (A little debugging with a watchpoint on it may help.)
10470      */
10471     if (SvANY(proto_perl->Ilinestr)) {
10472         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10473         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10474         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10475         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10476         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10477         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10478         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10479         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10480         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10481     }
10482     else {
10483         PL_linestr = NEWSV(65,79);
10484         sv_upgrade(PL_linestr,SVt_PVIV);
10485         sv_setpvn(PL_linestr,"",0);
10486         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10487     }
10488     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10489     PL_pending_ident    = proto_perl->Ipending_ident;
10490     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10491
10492     PL_expect           = proto_perl->Iexpect;
10493
10494     PL_multi_start      = proto_perl->Imulti_start;
10495     PL_multi_end        = proto_perl->Imulti_end;
10496     PL_multi_open       = proto_perl->Imulti_open;
10497     PL_multi_close      = proto_perl->Imulti_close;
10498
10499     PL_error_count      = proto_perl->Ierror_count;
10500     PL_subline          = proto_perl->Isubline;
10501     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10502
10503     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10504     if (SvANY(proto_perl->Ilinestr)) {
10505         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10506         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10507         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10508         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10509         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10510     }
10511     else {
10512         PL_last_uni     = SvPVX(PL_linestr);
10513         PL_last_lop     = SvPVX(PL_linestr);
10514         PL_last_lop_op  = 0;
10515     }
10516     PL_in_my            = proto_perl->Iin_my;
10517     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10518 #ifdef FCRYPT
10519     PL_cryptseen        = proto_perl->Icryptseen;
10520 #endif
10521
10522     PL_hints            = proto_perl->Ihints;
10523
10524     PL_amagic_generation        = proto_perl->Iamagic_generation;
10525
10526 #ifdef USE_LOCALE_COLLATE
10527     PL_collation_ix     = proto_perl->Icollation_ix;
10528     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10529     PL_collation_standard       = proto_perl->Icollation_standard;
10530     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10531     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10532 #endif /* USE_LOCALE_COLLATE */
10533
10534 #ifdef USE_LOCALE_NUMERIC
10535     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10536     PL_numeric_standard = proto_perl->Inumeric_standard;
10537     PL_numeric_local    = proto_perl->Inumeric_local;
10538     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10539 #endif /* !USE_LOCALE_NUMERIC */
10540
10541     /* utf8 character classes */
10542     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10543     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10544     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10545     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10546     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10547     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10548     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10549     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10550     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10551     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10552     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10553     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10554     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10555     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10556     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10557     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10558     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10559     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10560     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10561     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10562
10563     /* Did the locale setup indicate UTF-8? */
10564     PL_utf8locale       = proto_perl->Iutf8locale;
10565     /* Unicode features (see perlrun/-C) */
10566     PL_unicode          = proto_perl->Iunicode;
10567
10568     /* Pre-5.8 signals control */
10569     PL_signals          = proto_perl->Isignals;
10570
10571     /* times() ticks per second */
10572     PL_clocktick        = proto_perl->Iclocktick;
10573
10574     /* Recursion stopper for PerlIO_find_layer */
10575     PL_in_load_module   = proto_perl->Iin_load_module;
10576
10577     /* sort() routine */
10578     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10579
10580     /* Not really needed/useful since the reenrant_retint is "volatile",
10581      * but do it for consistency's sake. */
10582     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10583
10584     /* Hooks to shared SVs and locks. */
10585     PL_sharehook        = proto_perl->Isharehook;
10586     PL_lockhook         = proto_perl->Ilockhook;
10587     PL_unlockhook       = proto_perl->Iunlockhook;
10588     PL_threadhook       = proto_perl->Ithreadhook;
10589
10590     PL_runops_std       = proto_perl->Irunops_std;
10591     PL_runops_dbg       = proto_perl->Irunops_dbg;
10592
10593 #ifdef THREADS_HAVE_PIDS
10594     PL_ppid             = proto_perl->Ippid;
10595 #endif
10596
10597     /* swatch cache */
10598     PL_last_swash_hv    = Nullhv;       /* reinits on demand */
10599     PL_last_swash_klen  = 0;
10600     PL_last_swash_key[0]= '\0';
10601     PL_last_swash_tmps  = (U8*)NULL;
10602     PL_last_swash_slen  = 0;
10603
10604     PL_glob_index       = proto_perl->Iglob_index;
10605     PL_srand_called     = proto_perl->Isrand_called;
10606     PL_uudmap['M']      = 0;            /* reinits on demand */
10607     PL_bitcount         = Nullch;       /* reinits on demand */
10608
10609     if (proto_perl->Ipsig_pend) {
10610         Newxz(PL_psig_pend, SIG_SIZE, int);
10611     }
10612     else {
10613         PL_psig_pend    = (int*)NULL;
10614     }
10615
10616     if (proto_perl->Ipsig_ptr) {
10617         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10618         Newxz(PL_psig_name, SIG_SIZE, SV*);
10619         for (i = 1; i < SIG_SIZE; i++) {
10620             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10621             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10622         }
10623     }
10624     else {
10625         PL_psig_ptr     = (SV**)NULL;
10626         PL_psig_name    = (SV**)NULL;
10627     }
10628
10629     /* thrdvar.h stuff */
10630
10631     if (flags & CLONEf_COPY_STACKS) {
10632         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10633         PL_tmps_ix              = proto_perl->Ttmps_ix;
10634         PL_tmps_max             = proto_perl->Ttmps_max;
10635         PL_tmps_floor           = proto_perl->Ttmps_floor;
10636         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10637         i = 0;
10638         while (i <= PL_tmps_ix) {
10639             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10640             ++i;
10641         }
10642
10643         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10644         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10645         Newxz(PL_markstack, i, I32);
10646         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10647                                                   - proto_perl->Tmarkstack);
10648         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10649                                                   - proto_perl->Tmarkstack);
10650         Copy(proto_perl->Tmarkstack, PL_markstack,
10651              PL_markstack_ptr - PL_markstack + 1, I32);
10652
10653         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10654          * NOTE: unlike the others! */
10655         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10656         PL_scopestack_max       = proto_perl->Tscopestack_max;
10657         Newxz(PL_scopestack, PL_scopestack_max, I32);
10658         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10659
10660         /* NOTE: si_dup() looks at PL_markstack */
10661         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10662
10663         /* PL_curstack          = PL_curstackinfo->si_stack; */
10664         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10665         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10666
10667         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10668         PL_stack_base           = AvARRAY(PL_curstack);
10669         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10670                                                    - proto_perl->Tstack_base);
10671         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10672
10673         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10674          * NOTE: unlike the others! */
10675         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10676         PL_savestack_max        = proto_perl->Tsavestack_max;
10677         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10678         PL_savestack            = ss_dup(proto_perl, param);
10679     }
10680     else {
10681         init_stacks();
10682         ENTER;                  /* perl_destruct() wants to LEAVE; */
10683     }
10684
10685     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10686     PL_top_env          = &PL_start_env;
10687
10688     PL_op               = proto_perl->Top;
10689
10690     PL_Sv               = Nullsv;
10691     PL_Xpv              = (XPV*)NULL;
10692     PL_na               = proto_perl->Tna;
10693
10694     PL_statbuf          = proto_perl->Tstatbuf;
10695     PL_statcache        = proto_perl->Tstatcache;
10696     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10697     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10698 #ifdef HAS_TIMES
10699     PL_timesbuf         = proto_perl->Ttimesbuf;
10700 #endif
10701
10702     PL_tainted          = proto_perl->Ttainted;
10703     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10704     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10705     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10706     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10707     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10708     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10709     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10710     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10711     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10712
10713     PL_restartop        = proto_perl->Trestartop;
10714     PL_in_eval          = proto_perl->Tin_eval;
10715     PL_delaymagic       = proto_perl->Tdelaymagic;
10716     PL_dirty            = proto_perl->Tdirty;
10717     PL_localizing       = proto_perl->Tlocalizing;
10718
10719     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10720     PL_hv_fetch_ent_mh  = Nullhe;
10721     PL_modcount         = proto_perl->Tmodcount;
10722     PL_lastgotoprobe    = Nullop;
10723     PL_dumpindent       = proto_perl->Tdumpindent;
10724
10725     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10726     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10727     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10728     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10729     PL_efloatbuf        = Nullch;               /* reinits on demand */
10730     PL_efloatsize       = 0;                    /* reinits on demand */
10731
10732     /* regex stuff */
10733
10734     PL_screamfirst      = NULL;
10735     PL_screamnext       = NULL;
10736     PL_maxscream        = -1;                   /* reinits on demand */
10737     PL_lastscream       = Nullsv;
10738
10739     PL_watchaddr        = NULL;
10740     PL_watchok          = Nullch;
10741
10742     PL_regdummy         = proto_perl->Tregdummy;
10743     PL_regprecomp       = Nullch;
10744     PL_regnpar          = 0;
10745     PL_regsize          = 0;
10746     PL_colorset         = 0;            /* reinits PL_colors[] */
10747     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10748     PL_reginput         = Nullch;
10749     PL_regbol           = Nullch;
10750     PL_regeol           = Nullch;
10751     PL_regstartp        = (I32*)NULL;
10752     PL_regendp          = (I32*)NULL;
10753     PL_reglastparen     = (U32*)NULL;
10754     PL_reglastcloseparen        = (U32*)NULL;
10755     PL_regtill          = Nullch;
10756     PL_reg_start_tmp    = (char**)NULL;
10757     PL_reg_start_tmpl   = 0;
10758     PL_regdata          = (struct reg_data*)NULL;
10759     PL_bostr            = Nullch;
10760     PL_reg_flags        = 0;
10761     PL_reg_eval_set     = 0;
10762     PL_regnarrate       = 0;
10763     PL_regprogram       = (regnode*)NULL;
10764     PL_regindent        = 0;
10765     PL_regcc            = (CURCUR*)NULL;
10766     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10767     PL_reg_re           = (regexp*)NULL;
10768     PL_reg_ganch        = Nullch;
10769     PL_reg_sv           = Nullsv;
10770     PL_reg_match_utf8   = FALSE;
10771     PL_reg_magic        = (MAGIC*)NULL;
10772     PL_reg_oldpos       = 0;
10773     PL_reg_oldcurpm     = (PMOP*)NULL;
10774     PL_reg_curpm        = (PMOP*)NULL;
10775     PL_reg_oldsaved     = Nullch;
10776     PL_reg_oldsavedlen  = 0;
10777 #ifdef PERL_OLD_COPY_ON_WRITE
10778     PL_nrs              = Nullsv;
10779 #endif
10780     PL_reg_maxiter      = 0;
10781     PL_reg_leftiter     = 0;
10782     PL_reg_poscache     = Nullch;
10783     PL_reg_poscache_size= 0;
10784
10785     /* RE engine - function pointers */
10786     PL_regcompp         = proto_perl->Tregcompp;
10787     PL_regexecp         = proto_perl->Tregexecp;
10788     PL_regint_start     = proto_perl->Tregint_start;
10789     PL_regint_string    = proto_perl->Tregint_string;
10790     PL_regfree          = proto_perl->Tregfree;
10791
10792     PL_reginterp_cnt    = 0;
10793     PL_reg_starttry     = 0;
10794
10795     /* Pluggable optimizer */
10796     PL_peepp            = proto_perl->Tpeepp;
10797
10798     PL_stashcache       = newHV();
10799
10800     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
10801         ptr_table_free(PL_ptr_table);
10802         PL_ptr_table = NULL;
10803     }
10804
10805     /* Call the ->CLONE method, if it exists, for each of the stashes
10806        identified by sv_dup() above.
10807     */
10808     while(av_len(param->stashes) != -1) {
10809         HV* const stash = (HV*) av_shift(param->stashes);
10810         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
10811         if (cloner && GvCV(cloner)) {
10812             dSP;
10813             ENTER;
10814             SAVETMPS;
10815             PUSHMARK(SP);
10816             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
10817             PUTBACK;
10818             call_sv((SV*)GvCV(cloner), G_DISCARD);
10819             FREETMPS;
10820             LEAVE;
10821         }
10822     }
10823
10824     SvREFCNT_dec(param->stashes);
10825
10826     /* orphaned? eg threads->new inside BEGIN or use */
10827     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
10828         (void)SvREFCNT_inc(PL_compcv);
10829         SAVEFREESV(PL_compcv);
10830     }
10831
10832     return my_perl;
10833 }
10834
10835 #endif /* USE_ITHREADS */
10836
10837 /*
10838 =head1 Unicode Support
10839
10840 =for apidoc sv_recode_to_utf8
10841
10842 The encoding is assumed to be an Encode object, on entry the PV
10843 of the sv is assumed to be octets in that encoding, and the sv
10844 will be converted into Unicode (and UTF-8).
10845
10846 If the sv already is UTF-8 (or if it is not POK), or if the encoding
10847 is not a reference, nothing is done to the sv.  If the encoding is not
10848 an C<Encode::XS> Encoding object, bad things will happen.
10849 (See F<lib/encoding.pm> and L<Encode>).
10850
10851 The PV of the sv is returned.
10852
10853 =cut */
10854
10855 char *
10856 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
10857 {
10858     dVAR;
10859     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
10860         SV *uni;
10861         STRLEN len;
10862         const char *s;
10863         dSP;
10864         ENTER;
10865         SAVETMPS;
10866         save_re_context();
10867         PUSHMARK(sp);
10868         EXTEND(SP, 3);
10869         XPUSHs(encoding);
10870         XPUSHs(sv);
10871 /*
10872   NI-S 2002/07/09
10873   Passing sv_yes is wrong - it needs to be or'ed set of constants
10874   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
10875   remove converted chars from source.
10876
10877   Both will default the value - let them.
10878
10879         XPUSHs(&PL_sv_yes);
10880 */
10881         PUTBACK;
10882         call_method("decode", G_SCALAR);
10883         SPAGAIN;
10884         uni = POPs;
10885         PUTBACK;
10886         s = SvPV_const(uni, len);
10887         if (s != SvPVX_const(sv)) {
10888             SvGROW(sv, len + 1);
10889             Move(s, SvPVX(sv), len + 1, char);
10890             SvCUR_set(sv, len);
10891         }
10892         FREETMPS;
10893         LEAVE;
10894         SvUTF8_on(sv);
10895         return SvPVX(sv);
10896     }
10897     return SvPOKp(sv) ? SvPVX(sv) : NULL;
10898 }
10899
10900 /*
10901 =for apidoc sv_cat_decode
10902
10903 The encoding is assumed to be an Encode object, the PV of the ssv is
10904 assumed to be octets in that encoding and decoding the input starts
10905 from the position which (PV + *offset) pointed to.  The dsv will be
10906 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
10907 when the string tstr appears in decoding output or the input ends on
10908 the PV of the ssv. The value which the offset points will be modified
10909 to the last input position on the ssv.
10910
10911 Returns TRUE if the terminator was found, else returns FALSE.
10912
10913 =cut */
10914
10915 bool
10916 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
10917                    SV *ssv, int *offset, char *tstr, int tlen)
10918 {
10919     dVAR;
10920     bool ret = FALSE;
10921     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
10922         SV *offsv;
10923         dSP;
10924         ENTER;
10925         SAVETMPS;
10926         save_re_context();
10927         PUSHMARK(sp);
10928         EXTEND(SP, 6);
10929         XPUSHs(encoding);
10930         XPUSHs(dsv);
10931         XPUSHs(ssv);
10932         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
10933         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
10934         PUTBACK;
10935         call_method("cat_decode", G_SCALAR);
10936         SPAGAIN;
10937         ret = SvTRUE(TOPs);
10938         *offset = SvIV(offsv);
10939         PUTBACK;
10940         FREETMPS;
10941         LEAVE;
10942     }
10943     else
10944         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
10945     return ret;
10946
10947 }
10948
10949 /* ---------------------------------------------------------------------
10950  *
10951  * support functions for report_uninit()
10952  */
10953
10954 /* the maxiumum size of array or hash where we will scan looking
10955  * for the undefined element that triggered the warning */
10956
10957 #define FUV_MAX_SEARCH_SIZE 1000
10958
10959 /* Look for an entry in the hash whose value has the same SV as val;
10960  * If so, return a mortal copy of the key. */
10961
10962 STATIC SV*
10963 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
10964 {
10965     dVAR;
10966     register HE **array;
10967     I32 i;
10968
10969     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
10970                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
10971         return Nullsv;
10972
10973     array = HvARRAY(hv);
10974
10975     for (i=HvMAX(hv); i>0; i--) {
10976         register HE *entry;
10977         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
10978             if (HeVAL(entry) != val)
10979                 continue;
10980             if (    HeVAL(entry) == &PL_sv_undef ||
10981                     HeVAL(entry) == &PL_sv_placeholder)
10982                 continue;
10983             if (!HeKEY(entry))
10984                 return Nullsv;
10985             if (HeKLEN(entry) == HEf_SVKEY)
10986                 return sv_mortalcopy(HeKEY_sv(entry));
10987             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
10988         }
10989     }
10990     return Nullsv;
10991 }
10992
10993 /* Look for an entry in the array whose value has the same SV as val;
10994  * If so, return the index, otherwise return -1. */
10995
10996 STATIC I32
10997 S_find_array_subscript(pTHX_ AV *av, SV* val)
10998 {
10999     SV** svp;
11000     I32 i;
11001     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
11002                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
11003         return -1;
11004
11005     svp = AvARRAY(av);
11006     for (i=AvFILLp(av); i>=0; i--) {
11007         if (svp[i] == val && svp[i] != &PL_sv_undef)
11008             return i;
11009     }
11010     return -1;
11011 }
11012
11013 /* S_varname(): return the name of a variable, optionally with a subscript.
11014  * If gv is non-zero, use the name of that global, along with gvtype (one
11015  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11016  * targ.  Depending on the value of the subscript_type flag, return:
11017  */
11018
11019 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11020 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11021 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11022 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11023
11024 STATIC SV*
11025 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11026         SV* keyname, I32 aindex, int subscript_type)
11027 {
11028
11029     SV * const name = sv_newmortal();
11030     if (gv) {
11031         char buffer[2];
11032         buffer[0] = gvtype;
11033         buffer[1] = 0;
11034
11035         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11036
11037         gv_fullname4(name, gv, buffer, 0);
11038
11039         if ((unsigned int)SvPVX(name)[1] <= 26) {
11040             buffer[0] = '^';
11041             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11042
11043             /* Swap the 1 unprintable control character for the 2 byte pretty
11044                version - ie substr($name, 1, 1) = $buffer; */
11045             sv_insert(name, 1, 1, buffer, 2);
11046         }
11047     }
11048     else {
11049         U32 unused;
11050         CV * const cv = find_runcv(&unused);
11051         SV *sv;
11052         AV *av;
11053
11054         if (!cv || !CvPADLIST(cv))
11055             return Nullsv;
11056         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11057         sv = *av_fetch(av, targ, FALSE);
11058         /* SvLEN in a pad name is not to be trusted */
11059         sv_setpv(name, SvPV_nolen_const(sv));
11060     }
11061
11062     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11063         SV * const sv = NEWSV(0,0);
11064         *SvPVX(name) = '$';
11065         Perl_sv_catpvf(aTHX_ name, "{%s}",
11066             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11067         SvREFCNT_dec(sv);
11068     }
11069     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11070         *SvPVX(name) = '$';
11071         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11072     }
11073     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11074         sv_insert(name, 0, 0,  "within ", 7);
11075
11076     return name;
11077 }
11078
11079
11080 /*
11081 =for apidoc find_uninit_var
11082
11083 Find the name of the undefined variable (if any) that caused the operator o
11084 to issue a "Use of uninitialized value" warning.
11085 If match is true, only return a name if it's value matches uninit_sv.
11086 So roughly speaking, if a unary operator (such as OP_COS) generates a
11087 warning, then following the direct child of the op may yield an
11088 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11089 other hand, with OP_ADD there are two branches to follow, so we only print
11090 the variable name if we get an exact match.
11091
11092 The name is returned as a mortal SV.
11093
11094 Assumes that PL_op is the op that originally triggered the error, and that
11095 PL_comppad/PL_curpad points to the currently executing pad.
11096
11097 =cut
11098 */
11099
11100 STATIC SV *
11101 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11102 {
11103     dVAR;
11104     SV *sv;
11105     AV *av;
11106     GV *gv;
11107     OP *o, *o2, *kid;
11108
11109     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11110                             uninit_sv == &PL_sv_placeholder)))
11111         return Nullsv;
11112
11113     switch (obase->op_type) {
11114
11115     case OP_RV2AV:
11116     case OP_RV2HV:
11117     case OP_PADAV:
11118     case OP_PADHV:
11119       {
11120         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11121         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11122         I32 index = 0;
11123         SV *keysv = Nullsv;
11124         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11125
11126         if (pad) { /* @lex, %lex */
11127             sv = PAD_SVl(obase->op_targ);
11128             gv = Nullgv;
11129         }
11130         else {
11131             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11132             /* @global, %global */
11133                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11134                 if (!gv)
11135                     break;
11136                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11137             }
11138             else /* @{expr}, %{expr} */
11139                 return find_uninit_var(cUNOPx(obase)->op_first,
11140                                                     uninit_sv, match);
11141         }
11142
11143         /* attempt to find a match within the aggregate */
11144         if (hash) {
11145             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11146             if (keysv)
11147                 subscript_type = FUV_SUBSCRIPT_HASH;
11148         }
11149         else {
11150             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11151             if (index >= 0)
11152                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11153         }
11154
11155         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11156             break;
11157
11158         return varname(gv, hash ? '%' : '@', obase->op_targ,
11159                                     keysv, index, subscript_type);
11160       }
11161
11162     case OP_PADSV:
11163         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11164             break;
11165         return varname(Nullgv, '$', obase->op_targ,
11166                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11167
11168     case OP_GVSV:
11169         gv = cGVOPx_gv(obase);
11170         if (!gv || (match && GvSV(gv) != uninit_sv))
11171             break;
11172         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11173
11174     case OP_AELEMFAST:
11175         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11176             if (match) {
11177                 SV **svp;
11178                 av = (AV*)PAD_SV(obase->op_targ);
11179                 if (!av || SvRMAGICAL(av))
11180                     break;
11181                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11182                 if (!svp || *svp != uninit_sv)
11183                     break;
11184             }
11185             return varname(Nullgv, '$', obase->op_targ,
11186                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11187         }
11188         else {
11189             gv = cGVOPx_gv(obase);
11190             if (!gv)
11191                 break;
11192             if (match) {
11193                 SV **svp;
11194                 av = GvAV(gv);
11195                 if (!av || SvRMAGICAL(av))
11196                     break;
11197                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11198                 if (!svp || *svp != uninit_sv)
11199                     break;
11200             }
11201             return varname(gv, '$', 0,
11202                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11203         }
11204         break;
11205
11206     case OP_EXISTS:
11207         o = cUNOPx(obase)->op_first;
11208         if (!o || o->op_type != OP_NULL ||
11209                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11210             break;
11211         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11212
11213     case OP_AELEM:
11214     case OP_HELEM:
11215         if (PL_op == obase)
11216             /* $a[uninit_expr] or $h{uninit_expr} */
11217             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11218
11219         gv = Nullgv;
11220         o = cBINOPx(obase)->op_first;
11221         kid = cBINOPx(obase)->op_last;
11222
11223         /* get the av or hv, and optionally the gv */
11224         sv = Nullsv;
11225         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11226             sv = PAD_SV(o->op_targ);
11227         }
11228         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11229                 && cUNOPo->op_first->op_type == OP_GV)
11230         {
11231             gv = cGVOPx_gv(cUNOPo->op_first);
11232             if (!gv)
11233                 break;
11234             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11235         }
11236         if (!sv)
11237             break;
11238
11239         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11240             /* index is constant */
11241             if (match) {
11242                 if (SvMAGICAL(sv))
11243                     break;
11244                 if (obase->op_type == OP_HELEM) {
11245                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11246                     if (!he || HeVAL(he) != uninit_sv)
11247                         break;
11248                 }
11249                 else {
11250                     SV * const * const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11251                     if (!svp || *svp != uninit_sv)
11252                         break;
11253                 }
11254             }
11255             if (obase->op_type == OP_HELEM)
11256                 return varname(gv, '%', o->op_targ,
11257                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11258             else
11259                 return varname(gv, '@', o->op_targ, Nullsv,
11260                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11261         }
11262         else  {
11263             /* index is an expression;
11264              * attempt to find a match within the aggregate */
11265             if (obase->op_type == OP_HELEM) {
11266                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11267                 if (keysv)
11268                     return varname(gv, '%', o->op_targ,
11269                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11270             }
11271             else {
11272                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11273                 if (index >= 0)
11274                     return varname(gv, '@', o->op_targ,
11275                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11276             }
11277             if (match)
11278                 break;
11279             return varname(gv,
11280                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11281                 ? '@' : '%',
11282                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11283         }
11284
11285         break;
11286
11287     case OP_AASSIGN:
11288         /* only examine RHS */
11289         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11290
11291     case OP_OPEN:
11292         o = cUNOPx(obase)->op_first;
11293         if (o->op_type == OP_PUSHMARK)
11294             o = o->op_sibling;
11295
11296         if (!o->op_sibling) {
11297             /* one-arg version of open is highly magical */
11298
11299             if (o->op_type == OP_GV) { /* open FOO; */
11300                 gv = cGVOPx_gv(o);
11301                 if (match && GvSV(gv) != uninit_sv)
11302                     break;
11303                 return varname(gv, '$', 0,
11304                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11305             }
11306             /* other possibilities not handled are:
11307              * open $x; or open my $x;  should return '${*$x}'
11308              * open expr;               should return '$'.expr ideally
11309              */
11310              break;
11311         }
11312         goto do_op;
11313
11314     /* ops where $_ may be an implicit arg */
11315     case OP_TRANS:
11316     case OP_SUBST:
11317     case OP_MATCH:
11318         if ( !(obase->op_flags & OPf_STACKED)) {
11319             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11320                                  ? PAD_SVl(obase->op_targ)
11321                                  : DEFSV))
11322             {
11323                 sv = sv_newmortal();
11324                 sv_setpvn(sv, "$_", 2);
11325                 return sv;
11326             }
11327         }
11328         goto do_op;
11329
11330     case OP_PRTF:
11331     case OP_PRINT:
11332         /* skip filehandle as it can't produce 'undef' warning  */
11333         o = cUNOPx(obase)->op_first;
11334         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11335             o = o->op_sibling->op_sibling;
11336         goto do_op2;
11337
11338
11339     case OP_RV2SV:
11340     case OP_CUSTOM:
11341     case OP_ENTERSUB:
11342         match = 1; /* XS or custom code could trigger random warnings */
11343         goto do_op;
11344
11345     case OP_SCHOMP:
11346     case OP_CHOMP:
11347         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11348             return sv_2mortal(newSVpvn("${$/}", 5));
11349         /* FALL THROUGH */
11350
11351     default:
11352     do_op:
11353         if (!(obase->op_flags & OPf_KIDS))
11354             break;
11355         o = cUNOPx(obase)->op_first;
11356         
11357     do_op2:
11358         if (!o)
11359             break;
11360
11361         /* if all except one arg are constant, or have no side-effects,
11362          * or are optimized away, then it's unambiguous */
11363         o2 = Nullop;
11364         for (kid=o; kid; kid = kid->op_sibling) {
11365             if (kid &&
11366                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11367                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11368                   || (kid->op_type == OP_PUSHMARK)
11369                 )
11370             )
11371                 continue;
11372             if (o2) { /* more than one found */
11373                 o2 = Nullop;
11374                 break;
11375             }
11376             o2 = kid;
11377         }
11378         if (o2)
11379             return find_uninit_var(o2, uninit_sv, match);
11380
11381         /* scan all args */
11382         while (o) {
11383             sv = find_uninit_var(o, uninit_sv, 1);
11384             if (sv)
11385                 return sv;
11386             o = o->op_sibling;
11387         }
11388         break;
11389     }
11390     return Nullsv;
11391 }
11392
11393
11394 /*
11395 =for apidoc report_uninit
11396
11397 Print appropriate "Use of uninitialized variable" warning
11398
11399 =cut
11400 */
11401
11402 void
11403 Perl_report_uninit(pTHX_ SV* uninit_sv)
11404 {
11405     if (PL_op) {
11406         SV* varname = Nullsv;
11407         if (uninit_sv) {
11408             varname = find_uninit_var(PL_op, uninit_sv,0);
11409             if (varname)
11410                 sv_insert(varname, 0, 0, " ", 1);
11411         }
11412         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11413                 varname ? SvPV_nolen_const(varname) : "",
11414                 " in ", OP_DESC(PL_op));
11415     }
11416     else
11417         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11418                     "", "", "");
11419 }
11420
11421 /*
11422  * Local variables:
11423  * c-indentation-style: bsd
11424  * c-basic-offset: 4
11425  * indent-tabs-mode: t
11426  * End:
11427  *
11428  * ex: set ts=8 sts=4 sw=4 noet:
11429  */