Fixup the setsockopt usage message; missing OPTVAL.
[p5sagit/p5-mst-13.2.git] / sv.c
1 /*    sv.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
4  *    2000, 2001, 2002, 2003, 2004, 2005, by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  * "I wonder what the Entish is for 'yes' and 'no'," he thought.
10  *
11  *
12  * This file contains the code that creates, manipulates and destroys
13  * scalar values (SVs). The other types (AV, HV, GV, etc.) reuse the
14  * structure of an SV, so their creation and destruction is handled
15  * here; higher-level functions are in av.c, hv.c, and so on. Opcode
16  * level functions (eg. substr, split, join) for each of the types are
17  * in the pp*.c files.
18  */
19
20 #include "EXTERN.h"
21 #define PERL_IN_SV_C
22 #include "perl.h"
23 #include "regcomp.h"
24
25 #define FCALL *f
26
27 #ifdef __Lynx__
28 /* Missing proto on LynxOS */
29   char *gconvert(double, int, int,  char *);
30 #endif
31
32 #ifdef PERL_UTF8_CACHE_ASSERT
33 /* The cache element 0 is the Unicode offset;
34  * the cache element 1 is the byte offset of the element 0;
35  * the cache element 2 is the Unicode length of the substring;
36  * the cache element 3 is the byte length of the substring;
37  * The checking of the substring side would be good
38  * but substr() has enough code paths to make my head spin;
39  * if adding more checks watch out for the following tests:
40  *   t/op/index.t t/op/length.t t/op/pat.t t/op/substr.t
41  *   lib/utf8.t lib/Unicode/Collate/t/index.t
42  * --jhi
43  */
44 #define ASSERT_UTF8_CACHE(cache) \
45         STMT_START { if (cache) { assert((cache)[0] <= (cache)[1]); } } STMT_END
46 #else
47 #define ASSERT_UTF8_CACHE(cache) NOOP
48 #endif
49
50 #ifdef PERL_OLD_COPY_ON_WRITE
51 #define SV_COW_NEXT_SV(sv)      INT2PTR(SV *,SvUVX(sv))
52 #define SV_COW_NEXT_SV_SET(current,next)        SvUV_set(current, PTR2UV(next))
53 /* This is a pessimistic view. Scalar must be purely a read-write PV to copy-
54    on-write.  */
55 #endif
56
57 /* ============================================================================
58
59 =head1 Allocation and deallocation of SVs.
60
61 An SV (or AV, HV, etc.) is allocated in two parts: the head (struct sv,
62 av, hv...) contains type and reference count information, as well as a
63 pointer to the body (struct xrv, xpv, xpviv...), which contains fields
64 specific to each type.
65
66 In all but the most memory-paranoid configuations (ex: PURIFY), this
67 allocation is done using arenas, which by default are approximately 4K
68 chunks of memory parcelled up into N heads or bodies (of same size).
69 Sv-bodies are allocated by their sv-type, guaranteeing size
70 consistency needed to allocate safely from arrays.
71
72 The first slot in each arena is reserved, and is used to hold a link
73 to the next arena.  In the case of heads, the unused first slot also
74 contains some flags and a note of the number of slots.  Snaked through
75 each arena chain is a linked list of free items; when this becomes
76 empty, an extra arena is allocated and divided up into N items which
77 are threaded into the free list.
78
79 The following global variables are associated with arenas:
80
81     PL_sv_arenaroot     pointer to list of SV arenas
82     PL_sv_root          pointer to list of free SV structures
83
84     PL_body_arenaroots[]  array of pointers to list of arenas, 1 per svtype
85     PL_body_roots[]       array of pointers to list of free bodies of svtype
86                           arrays are indexed by the svtype needed
87
88 Note that some of the larger and more rarely used body types (eg
89 xpvio) are not allocated using arenas, but are instead just
90 malloc()/free()ed as required.
91
92 In addition, a few SV heads are not allocated from an arena, but are
93 instead directly created as static or auto variables, eg PL_sv_undef.
94 The size of arenas can be changed from the default by setting
95 PERL_ARENA_SIZE appropriately at compile time.
96
97 The SV arena serves the secondary purpose of allowing still-live SVs
98 to be located and destroyed during final cleanup.
99
100 At the lowest level, the macros new_SV() and del_SV() grab and free
101 an SV head.  (If debugging with -DD, del_SV() calls the function S_del_sv()
102 to return the SV to the free list with error checking.) new_SV() calls
103 more_sv() / sv_add_arena() to add an extra arena if the free list is empty.
104 SVs in the free list have their SvTYPE field set to all ones.
105
106 Similarly, there are macros new_XIV()/del_XIV(), new_XNV()/del_XNV() etc
107 that allocate and return individual body types. Normally these are mapped
108 to the arena-manipulating functions new_xiv()/del_xiv() etc, but may be
109 instead mapped directly to malloc()/free() if PURIFY is defined. The
110 new/del functions remove from, or add to, the appropriate PL_foo_root
111 list, and call more_xiv() etc to add a new arena if the list is empty.
112
113 At the time of very final cleanup, sv_free_arenas() is called from
114 perl_destruct() to physically free all the arenas allocated since the
115 start of the interpreter.
116
117 Manipulation of any of the PL_*root pointers is protected by enclosing
118 LOCK_SV_MUTEX; ... UNLOCK_SV_MUTEX calls which should Do the Right Thing
119 if threads are enabled.
120
121 The function visit() scans the SV arenas list, and calls a specified
122 function for each SV it finds which is still live - ie which has an SvTYPE
123 other than all 1's, and a non-zero SvREFCNT. visit() is used by the
124 following functions (specified as [function that calls visit()] / [function
125 called by visit() for each SV]):
126
127     sv_report_used() / do_report_used()
128                         dump all remaining SVs (debugging aid)
129
130     sv_clean_objs() / do_clean_objs(),do_clean_named_objs()
131                         Attempt to free all objects pointed to by RVs,
132                         and, unless DISABLE_DESTRUCTOR_KLUDGE is defined,
133                         try to do the same for all objects indirectly
134                         referenced by typeglobs too.  Called once from
135                         perl_destruct(), prior to calling sv_clean_all()
136                         below.
137
138     sv_clean_all() / do_clean_all()
139                         SvREFCNT_dec(sv) each remaining SV, possibly
140                         triggering an sv_free(). It also sets the
141                         SVf_BREAK flag on the SV to indicate that the
142                         refcnt has been artificially lowered, and thus
143                         stopping sv_free() from giving spurious warnings
144                         about SVs which unexpectedly have a refcnt
145                         of zero.  called repeatedly from perl_destruct()
146                         until there are no SVs left.
147
148 =head2 Arena allocator API Summary
149
150 Private API to rest of sv.c
151
152     new_SV(),  del_SV(),
153
154     new_XIV(), del_XIV(),
155     new_XNV(), del_XNV(),
156     etc
157
158 Public API:
159
160     sv_report_used(), sv_clean_objs(), sv_clean_all(), sv_free_arenas()
161
162
163 =cut
164
165 ============================================================================ */
166
167
168
169 /*
170  * "A time to plant, and a time to uproot what was planted..."
171  */
172
173 /*
174  * nice_chunk and nice_chunk size need to be set
175  * and queried under the protection of sv_mutex
176  */
177 void
178 Perl_offer_nice_chunk(pTHX_ void *chunk, U32 chunk_size)
179 {
180     void *new_chunk;
181     U32 new_chunk_size;
182     LOCK_SV_MUTEX;
183     new_chunk = (void *)(chunk);
184     new_chunk_size = (chunk_size);
185     if (new_chunk_size > PL_nice_chunk_size) {
186         Safefree(PL_nice_chunk);
187         PL_nice_chunk = (char *) new_chunk;
188         PL_nice_chunk_size = new_chunk_size;
189     } else {
190         Safefree(chunk);
191     }
192     UNLOCK_SV_MUTEX;
193 }
194
195 #ifdef DEBUG_LEAKING_SCALARS
196 #  define FREE_SV_DEBUG_FILE(sv) Safefree((sv)->sv_debug_file)
197 #else
198 #  define FREE_SV_DEBUG_FILE(sv)
199 #endif
200
201 #ifdef PERL_POISON
202 #  define SvARENA_CHAIN(sv)     ((sv)->sv_u.svu_rv)
203 /* Whilst I'd love to do this, it seems that things like to check on
204    unreferenced scalars
205 #  define POSION_SV_HEAD(sv)    Poison(sv, 1, struct STRUCT_SV)
206 */
207 #  define POSION_SV_HEAD(sv)    Poison(&SvANY(sv), 1, void *), \
208                                 Poison(&SvREFCNT(sv), 1, U32)
209 #else
210 #  define SvARENA_CHAIN(sv)     SvANY(sv)
211 #  define POSION_SV_HEAD(sv)
212 #endif
213
214 #define plant_SV(p) \
215     STMT_START {                                        \
216         FREE_SV_DEBUG_FILE(p);                          \
217         POSION_SV_HEAD(p);                              \
218         SvARENA_CHAIN(p) = (void *)PL_sv_root;          \
219         SvFLAGS(p) = SVTYPEMASK;                        \
220         PL_sv_root = (p);                               \
221         --PL_sv_count;                                  \
222     } STMT_END
223
224 /* sv_mutex must be held while calling uproot_SV() */
225 #define uproot_SV(p) \
226     STMT_START {                                        \
227         (p) = PL_sv_root;                               \
228         PL_sv_root = (SV*)SvARENA_CHAIN(p);                     \
229         ++PL_sv_count;                                  \
230     } STMT_END
231
232
233 /* make some more SVs by adding another arena */
234
235 /* sv_mutex must be held while calling more_sv() */
236 STATIC SV*
237 S_more_sv(pTHX)
238 {
239     SV* sv;
240
241     if (PL_nice_chunk) {
242         sv_add_arena(PL_nice_chunk, PL_nice_chunk_size, 0);
243         PL_nice_chunk = Nullch;
244         PL_nice_chunk_size = 0;
245     }
246     else {
247         char *chunk;                /* must use New here to match call to */
248         Newx(chunk,PERL_ARENA_SIZE,char);   /* Safefree() in sv_free_arenas()     */
249         sv_add_arena(chunk, PERL_ARENA_SIZE, 0);
250     }
251     uproot_SV(sv);
252     return sv;
253 }
254
255 /* new_SV(): return a new, empty SV head */
256
257 #ifdef DEBUG_LEAKING_SCALARS
258 /* provide a real function for a debugger to play with */
259 STATIC SV*
260 S_new_SV(pTHX)
261 {
262     SV* sv;
263
264     LOCK_SV_MUTEX;
265     if (PL_sv_root)
266         uproot_SV(sv);
267     else
268         sv = S_more_sv(aTHX);
269     UNLOCK_SV_MUTEX;
270     SvANY(sv) = 0;
271     SvREFCNT(sv) = 1;
272     SvFLAGS(sv) = 0;
273     sv->sv_debug_optype = PL_op ? PL_op->op_type : 0;
274     sv->sv_debug_line = (U16) ((PL_copline == NOLINE) ?
275         (PL_curcop ? CopLINE(PL_curcop) : 0) : PL_copline);
276     sv->sv_debug_inpad = 0;
277     sv->sv_debug_cloned = 0;
278     sv->sv_debug_file = PL_curcop ? savepv(CopFILE(PL_curcop)): NULL;
279     
280     return sv;
281 }
282 #  define new_SV(p) (p)=S_new_SV(aTHX)
283
284 #else
285 #  define new_SV(p) \
286     STMT_START {                                        \
287         LOCK_SV_MUTEX;                                  \
288         if (PL_sv_root)                                 \
289             uproot_SV(p);                               \
290         else                                            \
291             (p) = S_more_sv(aTHX);                      \
292         UNLOCK_SV_MUTEX;                                \
293         SvANY(p) = 0;                                   \
294         SvREFCNT(p) = 1;                                \
295         SvFLAGS(p) = 0;                                 \
296     } STMT_END
297 #endif
298
299
300 /* del_SV(): return an empty SV head to the free list */
301
302 #ifdef DEBUGGING
303
304 #define del_SV(p) \
305     STMT_START {                                        \
306         LOCK_SV_MUTEX;                                  \
307         if (DEBUG_D_TEST)                               \
308             del_sv(p);                                  \
309         else                                            \
310             plant_SV(p);                                \
311         UNLOCK_SV_MUTEX;                                \
312     } STMT_END
313
314 STATIC void
315 S_del_sv(pTHX_ SV *p)
316 {
317     if (DEBUG_D_TEST) {
318         SV* sva;
319         bool ok = 0;
320         for (sva = PL_sv_arenaroot; sva; sva = (SV *) SvANY(sva)) {
321             const SV * const sv = sva + 1;
322             const SV * const svend = &sva[SvREFCNT(sva)];
323             if (p >= sv && p < svend) {
324                 ok = 1;
325                 break;
326             }
327         }
328         if (!ok) {
329             if (ckWARN_d(WARN_INTERNAL))        
330                 Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
331                             "Attempt to free non-arena SV: 0x%"UVxf
332                             pTHX__FORMAT, PTR2UV(p) pTHX__VALUE);
333             return;
334         }
335     }
336     plant_SV(p);
337 }
338
339 #else /* ! DEBUGGING */
340
341 #define del_SV(p)   plant_SV(p)
342
343 #endif /* DEBUGGING */
344
345
346 /*
347 =head1 SV Manipulation Functions
348
349 =for apidoc sv_add_arena
350
351 Given a chunk of memory, link it to the head of the list of arenas,
352 and split it into a list of free SVs.
353
354 =cut
355 */
356
357 void
358 Perl_sv_add_arena(pTHX_ char *ptr, U32 size, U32 flags)
359 {
360     SV* const sva = (SV*)ptr;
361     register SV* sv;
362     register SV* svend;
363
364     /* The first SV in an arena isn't an SV. */
365     SvANY(sva) = (void *) PL_sv_arenaroot;              /* ptr to next arena */
366     SvREFCNT(sva) = size / sizeof(SV);          /* number of SV slots */
367     SvFLAGS(sva) = flags;                       /* FAKE if not to be freed */
368
369     PL_sv_arenaroot = sva;
370     PL_sv_root = sva + 1;
371
372     svend = &sva[SvREFCNT(sva) - 1];
373     sv = sva + 1;
374     while (sv < svend) {
375         SvARENA_CHAIN(sv) = (void *)(SV*)(sv + 1);
376 #ifdef DEBUGGING
377         SvREFCNT(sv) = 0;
378 #endif
379         /* Must always set typemask because it's awlays checked in on cleanup
380            when the arenas are walked looking for objects.  */
381         SvFLAGS(sv) = SVTYPEMASK;
382         sv++;
383     }
384     SvARENA_CHAIN(sv) = 0;
385 #ifdef DEBUGGING
386     SvREFCNT(sv) = 0;
387 #endif
388     SvFLAGS(sv) = SVTYPEMASK;
389 }
390
391 /* visit(): call the named function for each non-free SV in the arenas
392  * whose flags field matches the flags/mask args. */
393
394 STATIC I32
395 S_visit(pTHX_ SVFUNC_t f, U32 flags, U32 mask)
396 {
397     SV* sva;
398     I32 visited = 0;
399
400     for (sva = PL_sv_arenaroot; sva; sva = (SV*)SvANY(sva)) {
401         register const SV * const svend = &sva[SvREFCNT(sva)];
402         register SV* sv;
403         for (sv = sva + 1; sv < svend; ++sv) {
404             if (SvTYPE(sv) != SVTYPEMASK
405                     && (sv->sv_flags & mask) == flags
406                     && SvREFCNT(sv))
407             {
408                 (FCALL)(aTHX_ sv);
409                 ++visited;
410             }
411         }
412     }
413     return visited;
414 }
415
416 #ifdef DEBUGGING
417
418 /* called by sv_report_used() for each live SV */
419
420 static void
421 do_report_used(pTHX_ SV *sv)
422 {
423     if (SvTYPE(sv) != SVTYPEMASK) {
424         PerlIO_printf(Perl_debug_log, "****\n");
425         sv_dump(sv);
426     }
427 }
428 #endif
429
430 /*
431 =for apidoc sv_report_used
432
433 Dump the contents of all SVs not yet freed. (Debugging aid).
434
435 =cut
436 */
437
438 void
439 Perl_sv_report_used(pTHX)
440 {
441 #ifdef DEBUGGING
442     visit(do_report_used, 0, 0);
443 #endif
444 }
445
446 /* called by sv_clean_objs() for each live SV */
447
448 static void
449 do_clean_objs(pTHX_ SV *ref)
450 {
451     if (SvROK(ref)) {
452         SV * const target = SvRV(ref);
453         if (SvOBJECT(target)) {
454             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning object ref:\n "), sv_dump(ref)));
455             if (SvWEAKREF(ref)) {
456                 sv_del_backref(target, ref);
457                 SvWEAKREF_off(ref);
458                 SvRV_set(ref, NULL);
459             } else {
460                 SvROK_off(ref);
461                 SvRV_set(ref, NULL);
462                 SvREFCNT_dec(target);
463             }
464         }
465     }
466
467     /* XXX Might want to check arrays, etc. */
468 }
469
470 /* called by sv_clean_objs() for each live SV */
471
472 #ifndef DISABLE_DESTRUCTOR_KLUDGE
473 static void
474 do_clean_named_objs(pTHX_ SV *sv)
475 {
476     if (SvTYPE(sv) == SVt_PVGV && GvGP(sv)) {
477         if ((
478 #ifdef PERL_DONT_CREATE_GVSV
479              GvSV(sv) &&
480 #endif
481              SvOBJECT(GvSV(sv))) ||
482              (GvAV(sv) && SvOBJECT(GvAV(sv))) ||
483              (GvHV(sv) && SvOBJECT(GvHV(sv))) ||
484              (GvIO(sv) && SvOBJECT(GvIO(sv))) ||
485              (GvCV(sv) && SvOBJECT(GvCV(sv))) )
486         {
487             DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning named glob object:\n "), sv_dump(sv)));
488             SvFLAGS(sv) |= SVf_BREAK;
489             SvREFCNT_dec(sv);
490         }
491     }
492 }
493 #endif
494
495 /*
496 =for apidoc sv_clean_objs
497
498 Attempt to destroy all objects not yet freed
499
500 =cut
501 */
502
503 void
504 Perl_sv_clean_objs(pTHX)
505 {
506     PL_in_clean_objs = TRUE;
507     visit(do_clean_objs, SVf_ROK, SVf_ROK);
508 #ifndef DISABLE_DESTRUCTOR_KLUDGE
509     /* some barnacles may yet remain, clinging to typeglobs */
510     visit(do_clean_named_objs, SVt_PVGV, SVTYPEMASK);
511 #endif
512     PL_in_clean_objs = FALSE;
513 }
514
515 /* called by sv_clean_all() for each live SV */
516
517 static void
518 do_clean_all(pTHX_ SV *sv)
519 {
520     DEBUG_D((PerlIO_printf(Perl_debug_log, "Cleaning loops: SV at 0x%"UVxf"\n", PTR2UV(sv)) ));
521     SvFLAGS(sv) |= SVf_BREAK;
522     if (PL_comppad == (AV*)sv) {
523         PL_comppad = Nullav;
524         PL_curpad = Null(SV**);
525     }
526     SvREFCNT_dec(sv);
527 }
528
529 /*
530 =for apidoc sv_clean_all
531
532 Decrement the refcnt of each remaining SV, possibly triggering a
533 cleanup. This function may have to be called multiple times to free
534 SVs which are in complex self-referential hierarchies.
535
536 =cut
537 */
538
539 I32
540 Perl_sv_clean_all(pTHX)
541 {
542     I32 cleaned;
543     PL_in_clean_all = TRUE;
544     cleaned = visit(do_clean_all, 0,0);
545     PL_in_clean_all = FALSE;
546     return cleaned;
547 }
548
549 static void 
550 S_free_arena(pTHX_ void **root) {
551     while (root) {
552         void ** const next = *(void **)root;
553         Safefree(root);
554         root = next;
555     }
556 }
557     
558 /*
559 =for apidoc sv_free_arenas
560
561 Deallocate the memory used by all arenas. Note that all the individual SV
562 heads and bodies within the arenas must already have been freed.
563
564 =cut
565 */
566 #define free_arena(name)                                        \
567     STMT_START {                                                \
568         S_free_arena(aTHX_ (void**) PL_ ## name ## _arenaroot); \
569         PL_ ## name ## _arenaroot = 0;                          \
570         PL_ ## name ## _root = 0;                               \
571     } STMT_END
572
573 void
574 Perl_sv_free_arenas(pTHX)
575 {
576     SV* sva;
577     SV* svanext;
578     int i;
579
580     /* Free arenas here, but be careful about fake ones.  (We assume
581        contiguity of the fake ones with the corresponding real ones.) */
582
583     for (sva = PL_sv_arenaroot; sva; sva = svanext) {
584         svanext = (SV*) SvANY(sva);
585         while (svanext && SvFAKE(svanext))
586             svanext = (SV*) SvANY(svanext);
587
588         if (!SvFAKE(sva))
589             Safefree(sva);
590     }
591
592     for (i=0; i<SVt_LAST; i++) {
593         S_free_arena(aTHX_ (void**) PL_body_arenaroots[i]);
594         PL_body_arenaroots[i] = 0;
595         PL_body_roots[i] = 0;
596     }
597
598     Safefree(PL_nice_chunk);
599     PL_nice_chunk = Nullch;
600     PL_nice_chunk_size = 0;
601     PL_sv_arenaroot = 0;
602     PL_sv_root = 0;
603 }
604
605 /*
606   Here are mid-level routines that manage the allocation of bodies out
607   of the various arenas.  There are 5 kinds of arenas:
608
609   1. SV-head arenas, which are discussed and handled above
610   2. regular body arenas
611   3. arenas for reduced-size bodies
612   4. Hash-Entry arenas
613   5. pte arenas (thread related)
614
615   Arena types 2 & 3 are chained by body-type off an array of
616   arena-root pointers, which is indexed by svtype.  Some of the
617   larger/less used body types are malloced singly, since a large
618   unused block of them is wasteful.  Also, several svtypes dont have
619   bodies; the data fits into the sv-head itself.  The arena-root
620   pointer thus has a few unused root-pointers (which may be hijacked
621   later for arena types 4,5)
622
623   3 differs from 2 as an optimization; some body types have several
624   unused fields in the front of the structure (which are kept in-place
625   for consistency).  These bodies can be allocated in smaller chunks,
626   because the leading fields arent accessed.  Pointers to such bodies
627   are decremented to point at the unused 'ghost' memory, knowing that
628   the pointers are used with offsets to the real memory.
629
630   HE, HEK arenas are managed separately, with separate code, but may
631   be merge-able later..
632
633   PTE arenas are not sv-bodies, but they share these mid-level
634   mechanics, so are considered here.  The new mid-level mechanics rely
635   on the sv_type of the body being allocated, so we just reserve one
636   of the unused body-slots for PTEs, then use it in those (2) PTE
637   contexts below (line ~10k)
638 */
639
640 STATIC void *
641 S_more_bodies (pTHX_ size_t size, svtype sv_type)
642 {
643     void **arena_root   = &PL_body_arenaroots[sv_type];
644     void **root         = &PL_body_roots[sv_type];
645     char *start;
646     const char *end;
647     const size_t count = PERL_ARENA_SIZE / size;
648
649     Newx(start, count*size, char);
650     *((void **) start) = *arena_root;
651     *arena_root = (void *)start;
652
653     end = start + (count-1) * size;
654
655     /* The initial slot is used to link the arenas together, so it isn't to be
656        linked into the list of ready-to-use bodies.  */
657
658     start += size;
659
660     *root = (void *)start;
661
662     while (start < end) {
663         char * const next = start + size;
664         *(void**) start = (void *)next;
665         start = next;
666     }
667     *(void **)start = 0;
668
669     return *root;
670 }
671
672 /* grab a new thing from the free list, allocating more if necessary */
673
674 /* 1st, the inline version  */
675
676 #define new_body_inline(xpv, size, sv_type) \
677     STMT_START { \
678         void **r3wt = &PL_body_roots[sv_type]; \
679         LOCK_SV_MUTEX; \
680         xpv = *((void **)(r3wt)) \
681           ? *((void **)(r3wt)) : S_more_bodies(aTHX_ size, sv_type); \
682         *(r3wt) = *(void**)(xpv); \
683         UNLOCK_SV_MUTEX; \
684     } STMT_END
685
686 /* now use the inline version in the proper function */
687
688 #ifndef PURIFY
689
690 /* This isn't being used with -DPURIFY, so don't declare it. Otherwise
691    compilers issue warnings.  */
692
693 STATIC void *
694 S_new_body(pTHX_ size_t size, svtype sv_type)
695 {
696     void *xpv;
697     new_body_inline(xpv, size, sv_type);
698     return xpv;
699 }
700
701 #endif
702
703 /* return a thing to the free list */
704
705 #define del_body(thing, root)                   \
706     STMT_START {                                \
707         void **thing_copy = (void **)thing;     \
708         LOCK_SV_MUTEX;                          \
709         *thing_copy = *root;                    \
710         *root = (void*)thing_copy;              \
711         UNLOCK_SV_MUTEX;                        \
712     } STMT_END
713
714 /* 
715    Revisiting type 3 arenas, there are 4 body-types which have some
716    members that are never accessed.  They are XPV, XPVIV, XPVAV,
717    XPVHV, which have corresponding types: xpv_allocated,
718    xpviv_allocated, xpvav_allocated, xpvhv_allocated,
719
720    For these types, the arenas are carved up into *_allocated size
721    chunks, we thus avoid wasted memory for those unaccessed members.
722    When bodies are allocated, we adjust the pointer back in memory by
723    the size of the bit not allocated, so it's as if we allocated the
724    full structure.  (But things will all go boom if you write to the
725    part that is "not there", because you'll be overwriting the last
726    members of the preceding structure in memory.)
727
728    We calculate the correction using the STRUCT_OFFSET macro. For example, if
729    xpv_allocated is the same structure as XPV then the two OFFSETs sum to zero,
730    and the pointer is unchanged. If the allocated structure is smaller (no
731    initial NV actually allocated) then the net effect is to subtract the size
732    of the NV from the pointer, to return a new pointer as if an initial NV were
733    actually allocated.
734
735    This is the same trick as was used for NV and IV bodies. Ironically it
736    doesn't need to be used for NV bodies any more, because NV is now at the
737    start of the structure. IV bodies don't need it either, because they are
738    no longer allocated.  */
739
740 /* The following 2 arrays hide the above details in a pair of
741    lookup-tables, allowing us to be body-type agnostic.
742
743    size maps svtype to its body's allocated size.
744    offset maps svtype to the body-pointer adjustment needed
745
746    NB: elements in latter are 0 or <0, and are added during
747    allocation, and subtracted during deallocation.  It may be clearer
748    to invert the values, and call it shrinkage_by_svtype.
749 */
750
751 struct body_details {
752     size_t size;        /* Size to allocate  */
753     size_t copy;        /* Size of structure to copy (may be shorter)  */
754     size_t offset;
755     bool cant_upgrade;  /* Can upgrade this type */
756     bool zero_nv;       /* zero the NV when upgrading from this */
757     bool arena;         /* Allocated from an arena */
758 };
759
760 #define HADNV FALSE
761 #define NONV TRUE
762
763 #ifdef PURIFY
764 /* With -DPURFIY we allocate everything directly, and don't use arenas.
765    This seems a rather elegant way to simplify some of the code below.  */
766 #define HASARENA FALSE
767 #else
768 #define HASARENA TRUE
769 #endif
770 #define NOARENA FALSE
771
772 /* A macro to work out the offset needed to subtract from a pointer to (say)
773
774 typedef struct {
775     STRLEN      xpv_cur;
776     STRLEN      xpv_len;
777 } xpv_allocated;
778
779 to make its members accessible via a pointer to (say)
780
781 struct xpv {
782     NV          xnv_nv;
783     STRLEN      xpv_cur;
784     STRLEN      xpv_len;
785 };
786
787 */
788
789 #define relative_STRUCT_OFFSET(longer, shorter, member) \
790     (STRUCT_OFFSET(shorter, member) - STRUCT_OFFSET(longer, member))
791
792 /* Calculate the length to copy. Specifically work out the length less any
793    final padding the compiler needed to add.  See the comment in sv_upgrade
794    for why copying the padding proved to be a bug.  */
795
796 #define copy_length(type, last_member) \
797         STRUCT_OFFSET(type, last_member) \
798         + sizeof (((type*)SvANY((SV*)0))->last_member)
799
800 static const struct body_details bodies_by_type[] = {
801     {0, 0, 0, FALSE, NONV, NOARENA},
802     /* IVs are in the head, so the allocation size is 0  */
803     {0, sizeof(IV), STRUCT_OFFSET(XPVIV, xiv_iv), FALSE, NONV, NOARENA},
804     /* 8 bytes on most ILP32 with IEEE doubles */
805     {sizeof(NV), sizeof(NV), 0, FALSE, HADNV, HASARENA},
806     /* RVs are in the head now */
807     /* However, this slot is overloaded and used by the pte  */
808     {0, 0, 0, FALSE, NONV, NOARENA},
809     /* 8 bytes on most ILP32 with IEEE doubles */
810     {sizeof(xpv_allocated),
811      copy_length(XPV, xpv_len)
812      + relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
813      - relative_STRUCT_OFFSET(XPV, xpv_allocated, xpv_cur),
814      FALSE, NONV, HASARENA},
815     /* 12 */
816     {sizeof(xpviv_allocated),
817      copy_length(XPVIV, xiv_u)
818      + relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
819      - relative_STRUCT_OFFSET(XPVIV, xpviv_allocated, xpv_cur),
820      FALSE, NONV, HASARENA},
821     /* 20 */
822     {sizeof(XPVNV), copy_length(XPVNV, xiv_u), 0, FALSE, HADNV, HASARENA},
823     /* 28 */
824     {sizeof(XPVMG), copy_length(XPVMG, xmg_stash), 0, FALSE, HADNV, HASARENA},
825     /* 36 */
826     {sizeof(XPVBM), sizeof(XPVBM), 0, TRUE, HADNV, HASARENA},
827     /* 48 */
828     {sizeof(XPVGV), sizeof(XPVGV), 0, TRUE, HADNV, HASARENA},
829     /* 64 */
830     {sizeof(XPVLV), sizeof(XPVLV), 0, TRUE, HADNV, HASARENA},
831     /* 20 */
832     {sizeof(xpvav_allocated),
833      copy_length(XPVAV, xmg_stash)
834      + relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
835      - relative_STRUCT_OFFSET(XPVAV, xpvav_allocated, xav_fill),
836      TRUE, HADNV, HASARENA},
837     /* 20 */
838     {sizeof(xpvhv_allocated),
839      copy_length(XPVHV, xmg_stash)
840      + relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
841      - relative_STRUCT_OFFSET(XPVHV, xpvhv_allocated, xhv_fill),
842      TRUE, HADNV, HASARENA},
843     /* 76 */
844     {sizeof(XPVCV), sizeof(XPVCV), 0, TRUE, HADNV, HASARENA},
845     /* 80 */
846     {sizeof(XPVFM), sizeof(XPVFM), 0, TRUE, HADNV, NOARENA},
847     /* 84 */
848     {sizeof(XPVIO), sizeof(XPVIO), 0, TRUE, HADNV, NOARENA}
849 };
850
851 #define new_body_type(sv_type)                  \
852     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
853              - bodies_by_type[sv_type].offset)
854
855 #define del_body_type(p, sv_type)       \
856     del_body(p, &PL_body_roots[sv_type])
857
858
859 #define new_body_allocated(sv_type)             \
860     (void *)((char *)S_new_body(aTHX_ bodies_by_type[sv_type].size, sv_type)\
861              - bodies_by_type[sv_type].offset)
862
863 #define del_body_allocated(p, sv_type)          \
864     del_body(p + bodies_by_type[sv_type].offset, &PL_body_roots[sv_type])
865
866
867 #define my_safemalloc(s)        (void*)safemalloc(s)
868 #define my_safecalloc(s)        (void*)safecalloc(s, 1)
869 #define my_safefree(p)  safefree((char*)p)
870
871 #ifdef PURIFY
872
873 #define new_XNV()       my_safemalloc(sizeof(XPVNV))
874 #define del_XNV(p)      my_safefree(p)
875
876 #define new_XPVNV()     my_safemalloc(sizeof(XPVNV))
877 #define del_XPVNV(p)    my_safefree(p)
878
879 #define new_XPVAV()     my_safemalloc(sizeof(XPVAV))
880 #define del_XPVAV(p)    my_safefree(p)
881
882 #define new_XPVHV()     my_safemalloc(sizeof(XPVHV))
883 #define del_XPVHV(p)    my_safefree(p)
884
885 #define new_XPVMG()     my_safemalloc(sizeof(XPVMG))
886 #define del_XPVMG(p)    my_safefree(p)
887
888 #define new_XPVGV()     my_safemalloc(sizeof(XPVGV))
889 #define del_XPVGV(p)    my_safefree(p)
890
891 #else /* !PURIFY */
892
893 #define new_XNV()       new_body_type(SVt_NV)
894 #define del_XNV(p)      del_body_type(p, SVt_NV)
895
896 #define new_XPVNV()     new_body_type(SVt_PVNV)
897 #define del_XPVNV(p)    del_body_type(p, SVt_PVNV)
898
899 #define new_XPVAV()     new_body_allocated(SVt_PVAV)
900 #define del_XPVAV(p)    del_body_allocated(p, SVt_PVAV)
901
902 #define new_XPVHV()     new_body_allocated(SVt_PVHV)
903 #define del_XPVHV(p)    del_body_allocated(p, SVt_PVHV)
904
905 #define new_XPVMG()     new_body_type(SVt_PVMG)
906 #define del_XPVMG(p)    del_body_type(p, SVt_PVMG)
907
908 #define new_XPVGV()     new_body_type(SVt_PVGV)
909 #define del_XPVGV(p)    del_body_type(p, SVt_PVGV)
910
911 #endif /* PURIFY */
912
913 /* no arena for you! */
914
915 #define new_NOARENA(details) \
916         my_safemalloc((details)->size + (details)->offset)
917 #define new_NOARENAZ(details) \
918         my_safecalloc((details)->size + (details)->offset)
919
920 /*
921 =for apidoc sv_upgrade
922
923 Upgrade an SV to a more complex form.  Generally adds a new body type to the
924 SV, then copies across as much information as possible from the old body.
925 You generally want to use the C<SvUPGRADE> macro wrapper. See also C<svtype>.
926
927 =cut
928 */
929
930 void
931 Perl_sv_upgrade(pTHX_ register SV *sv, U32 new_type)
932 {
933     void*       old_body;
934     void*       new_body;
935     const U32   old_type = SvTYPE(sv);
936     const struct body_details *const old_type_details
937         = bodies_by_type + old_type;
938     const struct body_details *new_type_details = bodies_by_type + new_type;
939
940     if (new_type != SVt_PV && SvIsCOW(sv)) {
941         sv_force_normal_flags(sv, 0);
942     }
943
944     if (old_type == new_type)
945         return;
946
947     if (old_type > new_type)
948         Perl_croak(aTHX_ "sv_upgrade from type %d down to type %d",
949                 (int)old_type, (int)new_type);
950
951
952     old_body = SvANY(sv);
953
954     /* Copying structures onto other structures that have been neatly zeroed
955        has a subtle gotcha. Consider XPVMG
956
957        +------+------+------+------+------+-------+-------+
958        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |
959        +------+------+------+------+------+-------+-------+
960        0      4      8     12     16     20      24      28
961
962        where NVs are aligned to 8 bytes, so that sizeof that structure is
963        actually 32 bytes long, with 4 bytes of padding at the end:
964
965        +------+------+------+------+------+-------+-------+------+
966        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH | ???  |
967        +------+------+------+------+------+-------+-------+------+
968        0      4      8     12     16     20      24      28     32
969
970        so what happens if you allocate memory for this structure:
971
972        +------+------+------+------+------+-------+-------+------+------+...
973        |     NV      | CUR  | LEN  |  IV  | MAGIC | STASH |  GP  | NAME |
974        +------+------+------+------+------+-------+-------+------+------+...
975        0      4      8     12     16     20      24      28     32     36
976
977        zero it, then copy sizeof(XPVMG) bytes on top of it? Not quite what you
978        expect, because you copy the area marked ??? onto GP. Now, ??? may have
979        started out as zero once, but it's quite possible that it isn't. So now,
980        rather than a nicely zeroed GP, you have it pointing somewhere random.
981        Bugs ensue.
982
983        (In fact, GP ends up pointing at a previous GP structure, because the
984        principle cause of the padding in XPVMG getting garbage is a copy of
985        sizeof(XPVMG) bytes from a XPVGV structure in sv_unglob)
986
987        So we are careful and work out the size of used parts of all the
988        structures.  */
989
990     switch (old_type) {
991     case SVt_NULL:
992         break;
993     case SVt_IV:
994         if (new_type < SVt_PVIV) {
995             new_type = (new_type == SVt_NV)
996                 ? SVt_PVNV : SVt_PVIV;
997             new_type_details = bodies_by_type + new_type;
998         }
999         break;
1000     case SVt_NV:
1001         if (new_type < SVt_PVNV) {
1002             new_type = SVt_PVNV;
1003             new_type_details = bodies_by_type + new_type;
1004         }
1005         break;
1006     case SVt_RV:
1007         break;
1008     case SVt_PV:
1009         assert(new_type > SVt_PV);
1010         assert(SVt_IV < SVt_PV);
1011         assert(SVt_NV < SVt_PV);
1012         break;
1013     case SVt_PVIV:
1014         break;
1015     case SVt_PVNV:
1016         break;
1017     case SVt_PVMG:
1018         /* Because the XPVMG of PL_mess_sv isn't allocated from the arena,
1019            there's no way that it can be safely upgraded, because perl.c
1020            expects to Safefree(SvANY(PL_mess_sv))  */
1021         assert(sv != PL_mess_sv);
1022         /* This flag bit is used to mean other things in other scalar types.
1023            Given that it only has meaning inside the pad, it shouldn't be set
1024            on anything that can get upgraded.  */
1025         assert((SvFLAGS(sv) & SVpad_TYPED) == 0);
1026         break;
1027     default:
1028         if (old_type_details->cant_upgrade)
1029             Perl_croak(aTHX_ "Can't upgrade that kind of scalar");
1030     }
1031
1032     SvFLAGS(sv) &= ~SVTYPEMASK;
1033     SvFLAGS(sv) |= new_type;
1034
1035     switch (new_type) {
1036     case SVt_NULL:
1037         Perl_croak(aTHX_ "Can't upgrade to undef");
1038     case SVt_IV:
1039         assert(old_type == SVt_NULL);
1040         SvANY(sv) = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
1041         SvIV_set(sv, 0);
1042         return;
1043     case SVt_NV:
1044         assert(old_type == SVt_NULL);
1045         SvANY(sv) = new_XNV();
1046         SvNV_set(sv, 0);
1047         return;
1048     case SVt_RV:
1049         assert(old_type == SVt_NULL);
1050         SvANY(sv) = &sv->sv_u.svu_rv;
1051         SvRV_set(sv, 0);
1052         return;
1053     case SVt_PVHV:
1054         SvANY(sv) = new_XPVHV();
1055         HvFILL(sv)      = 0;
1056         HvMAX(sv)       = 0;
1057         HvTOTALKEYS(sv) = 0;
1058
1059         goto hv_av_common;
1060
1061     case SVt_PVAV:
1062         SvANY(sv) = new_XPVAV();
1063         AvMAX(sv)       = -1;
1064         AvFILLp(sv)     = -1;
1065         AvALLOC(sv)     = 0;
1066         AvREAL_only(sv);
1067
1068     hv_av_common:
1069         /* SVt_NULL isn't the only thing upgraded to AV or HV.
1070            The target created by newSVrv also is, and it can have magic.
1071            However, it never has SvPVX set.
1072         */
1073         if (old_type >= SVt_RV) {
1074             assert(SvPVX_const(sv) == 0);
1075         }
1076
1077         /* Could put this in the else clause below, as PVMG must have SvPVX
1078            0 already (the assertion above)  */
1079         SvPV_set(sv, (char*)0);
1080
1081         if (old_type >= SVt_PVMG) {
1082             SvMAGIC_set(sv, ((XPVMG*)old_body)->xmg_magic);
1083             SvSTASH_set(sv, ((XPVMG*)old_body)->xmg_stash);
1084         } else {
1085             SvMAGIC_set(sv, 0);
1086             SvSTASH_set(sv, 0);
1087         }
1088         break;
1089
1090
1091     case SVt_PVIV:
1092         /* XXX Is this still needed?  Was it ever needed?   Surely as there is
1093            no route from NV to PVIV, NOK can never be true  */
1094         assert(!SvNOKp(sv));
1095         assert(!SvNOK(sv));
1096     case SVt_PVIO:
1097     case SVt_PVFM:
1098     case SVt_PVBM:
1099     case SVt_PVGV:
1100     case SVt_PVCV:
1101     case SVt_PVLV:
1102     case SVt_PVMG:
1103     case SVt_PVNV:
1104     case SVt_PV:
1105
1106         assert(new_type_details->size);
1107         /* We always allocated the full length item with PURIFY. To do this
1108            we fake things so that arena is false for all 16 types..  */
1109         if(new_type_details->arena) {
1110             /* This points to the start of the allocated area.  */
1111             new_body_inline(new_body, new_type_details->size, new_type);
1112             Zero(new_body, new_type_details->size, char);
1113             new_body = ((char *)new_body) - new_type_details->offset;
1114         } else {
1115             new_body = new_NOARENAZ(new_type_details);
1116         }
1117         SvANY(sv) = new_body;
1118
1119         if (old_type_details->copy) {
1120             Copy((char *)old_body + old_type_details->offset,
1121                  (char *)new_body + old_type_details->offset,
1122                  old_type_details->copy, char);
1123         }
1124
1125 #ifndef NV_ZERO_IS_ALLBITS_ZERO
1126     /* If NV 0.0 is store as all bits 0 then Zero() already creates a correct
1127        0.0 for us.  */
1128         if (old_type_details->zero_nv)
1129             SvNV_set(sv, 0);
1130 #endif
1131
1132         if (new_type == SVt_PVIO)
1133             IoPAGE_LEN(sv)      = 60;
1134         if (old_type < SVt_RV)
1135             SvPV_set(sv, 0);
1136         break;
1137     default:
1138         Perl_croak(aTHX_ "panic: sv_upgrade to unknown type %lu", new_type);
1139     }
1140
1141     if (old_type_details->size) {
1142         /* If the old body had an allocated size, then we need to free it.  */
1143 #ifdef PURIFY
1144         my_safefree(old_body);
1145 #else
1146         del_body((void*)((char*)old_body + old_type_details->offset),
1147                  &PL_body_roots[old_type]);
1148 #endif
1149     }
1150 }
1151
1152 /*
1153 =for apidoc sv_backoff
1154
1155 Remove any string offset. You should normally use the C<SvOOK_off> macro
1156 wrapper instead.
1157
1158 =cut
1159 */
1160
1161 int
1162 Perl_sv_backoff(pTHX_ register SV *sv)
1163 {
1164     assert(SvOOK(sv));
1165     assert(SvTYPE(sv) != SVt_PVHV);
1166     assert(SvTYPE(sv) != SVt_PVAV);
1167     if (SvIVX(sv)) {
1168         const char * const s = SvPVX_const(sv);
1169         SvLEN_set(sv, SvLEN(sv) + SvIVX(sv));
1170         SvPV_set(sv, SvPVX(sv) - SvIVX(sv));
1171         SvIV_set(sv, 0);
1172         Move(s, SvPVX(sv), SvCUR(sv)+1, char);
1173     }
1174     SvFLAGS(sv) &= ~SVf_OOK;
1175     return 0;
1176 }
1177
1178 /*
1179 =for apidoc sv_grow
1180
1181 Expands the character buffer in the SV.  If necessary, uses C<sv_unref> and
1182 upgrades the SV to C<SVt_PV>.  Returns a pointer to the character buffer.
1183 Use the C<SvGROW> wrapper instead.
1184
1185 =cut
1186 */
1187
1188 char *
1189 Perl_sv_grow(pTHX_ register SV *sv, register STRLEN newlen)
1190 {
1191     register char *s;
1192
1193 #ifdef HAS_64K_LIMIT
1194     if (newlen >= 0x10000) {
1195         PerlIO_printf(Perl_debug_log,
1196                       "Allocation too large: %"UVxf"\n", (UV)newlen);
1197         my_exit(1);
1198     }
1199 #endif /* HAS_64K_LIMIT */
1200     if (SvROK(sv))
1201         sv_unref(sv);
1202     if (SvTYPE(sv) < SVt_PV) {
1203         sv_upgrade(sv, SVt_PV);
1204         s = SvPVX_mutable(sv);
1205     }
1206     else if (SvOOK(sv)) {       /* pv is offset? */
1207         sv_backoff(sv);
1208         s = SvPVX_mutable(sv);
1209         if (newlen > SvLEN(sv))
1210             newlen += 10 * (newlen - SvCUR(sv)); /* avoid copy each time */
1211 #ifdef HAS_64K_LIMIT
1212         if (newlen >= 0x10000)
1213             newlen = 0xFFFF;
1214 #endif
1215     }
1216     else
1217         s = SvPVX_mutable(sv);
1218
1219     if (newlen > SvLEN(sv)) {           /* need more room? */
1220         newlen = PERL_STRLEN_ROUNDUP(newlen);
1221         if (SvLEN(sv) && s) {
1222 #ifdef MYMALLOC
1223             const STRLEN l = malloced_size((void*)SvPVX_const(sv));
1224             if (newlen <= l) {
1225                 SvLEN_set(sv, l);
1226                 return s;
1227             } else
1228 #endif
1229             s = saferealloc(s, newlen);
1230         }
1231         else {
1232             s = safemalloc(newlen);
1233             if (SvPVX_const(sv) && SvCUR(sv)) {
1234                 Move(SvPVX_const(sv), s, (newlen < SvCUR(sv)) ? newlen : SvCUR(sv), char);
1235             }
1236         }
1237         SvPV_set(sv, s);
1238         SvLEN_set(sv, newlen);
1239     }
1240     return s;
1241 }
1242
1243 /*
1244 =for apidoc sv_setiv
1245
1246 Copies an integer into the given SV, upgrading first if necessary.
1247 Does not handle 'set' magic.  See also C<sv_setiv_mg>.
1248
1249 =cut
1250 */
1251
1252 void
1253 Perl_sv_setiv(pTHX_ register SV *sv, IV i)
1254 {
1255     SV_CHECK_THINKFIRST_COW_DROP(sv);
1256     switch (SvTYPE(sv)) {
1257     case SVt_NULL:
1258         sv_upgrade(sv, SVt_IV);
1259         break;
1260     case SVt_NV:
1261         sv_upgrade(sv, SVt_PVNV);
1262         break;
1263     case SVt_RV:
1264     case SVt_PV:
1265         sv_upgrade(sv, SVt_PVIV);
1266         break;
1267
1268     case SVt_PVGV:
1269     case SVt_PVAV:
1270     case SVt_PVHV:
1271     case SVt_PVCV:
1272     case SVt_PVFM:
1273     case SVt_PVIO:
1274         Perl_croak(aTHX_ "Can't coerce %s to integer in %s", sv_reftype(sv,0),
1275                    OP_DESC(PL_op));
1276     }
1277     (void)SvIOK_only(sv);                       /* validate number */
1278     SvIV_set(sv, i);
1279     SvTAINT(sv);
1280 }
1281
1282 /*
1283 =for apidoc sv_setiv_mg
1284
1285 Like C<sv_setiv>, but also handles 'set' magic.
1286
1287 =cut
1288 */
1289
1290 void
1291 Perl_sv_setiv_mg(pTHX_ register SV *sv, IV i)
1292 {
1293     sv_setiv(sv,i);
1294     SvSETMAGIC(sv);
1295 }
1296
1297 /*
1298 =for apidoc sv_setuv
1299
1300 Copies an unsigned integer into the given SV, upgrading first if necessary.
1301 Does not handle 'set' magic.  See also C<sv_setuv_mg>.
1302
1303 =cut
1304 */
1305
1306 void
1307 Perl_sv_setuv(pTHX_ register SV *sv, UV u)
1308 {
1309     /* With these two if statements:
1310        u=1.49  s=0.52  cu=72.49  cs=10.64  scripts=270  tests=20865
1311
1312        without
1313        u=1.35  s=0.47  cu=73.45  cs=11.43  scripts=270  tests=20865
1314
1315        If you wish to remove them, please benchmark to see what the effect is
1316     */
1317     if (u <= (UV)IV_MAX) {
1318        sv_setiv(sv, (IV)u);
1319        return;
1320     }
1321     sv_setiv(sv, 0);
1322     SvIsUV_on(sv);
1323     SvUV_set(sv, u);
1324 }
1325
1326 /*
1327 =for apidoc sv_setuv_mg
1328
1329 Like C<sv_setuv>, but also handles 'set' magic.
1330
1331 =cut
1332 */
1333
1334 void
1335 Perl_sv_setuv_mg(pTHX_ register SV *sv, UV u)
1336 {
1337     sv_setiv(sv, 0);
1338     SvIsUV_on(sv);
1339     sv_setuv(sv,u);
1340     SvSETMAGIC(sv);
1341 }
1342
1343 /*
1344 =for apidoc sv_setnv
1345
1346 Copies a double into the given SV, upgrading first if necessary.
1347 Does not handle 'set' magic.  See also C<sv_setnv_mg>.
1348
1349 =cut
1350 */
1351
1352 void
1353 Perl_sv_setnv(pTHX_ register SV *sv, NV num)
1354 {
1355     SV_CHECK_THINKFIRST_COW_DROP(sv);
1356     switch (SvTYPE(sv)) {
1357     case SVt_NULL:
1358     case SVt_IV:
1359         sv_upgrade(sv, SVt_NV);
1360         break;
1361     case SVt_RV:
1362     case SVt_PV:
1363     case SVt_PVIV:
1364         sv_upgrade(sv, SVt_PVNV);
1365         break;
1366
1367     case SVt_PVGV:
1368     case SVt_PVAV:
1369     case SVt_PVHV:
1370     case SVt_PVCV:
1371     case SVt_PVFM:
1372     case SVt_PVIO:
1373         Perl_croak(aTHX_ "Can't coerce %s to number in %s", sv_reftype(sv,0),
1374                    OP_NAME(PL_op));
1375     }
1376     SvNV_set(sv, num);
1377     (void)SvNOK_only(sv);                       /* validate number */
1378     SvTAINT(sv);
1379 }
1380
1381 /*
1382 =for apidoc sv_setnv_mg
1383
1384 Like C<sv_setnv>, but also handles 'set' magic.
1385
1386 =cut
1387 */
1388
1389 void
1390 Perl_sv_setnv_mg(pTHX_ register SV *sv, NV num)
1391 {
1392     sv_setnv(sv,num);
1393     SvSETMAGIC(sv);
1394 }
1395
1396 /* Print an "isn't numeric" warning, using a cleaned-up,
1397  * printable version of the offending string
1398  */
1399
1400 STATIC void
1401 S_not_a_number(pTHX_ SV *sv)
1402 {
1403      SV *dsv;
1404      char tmpbuf[64];
1405      const char *pv;
1406
1407      if (DO_UTF8(sv)) {
1408           dsv = sv_2mortal(newSVpvn("", 0));
1409           pv = sv_uni_display(dsv, sv, 10, 0);
1410      } else {
1411           char *d = tmpbuf;
1412           const char * const limit = tmpbuf + sizeof(tmpbuf) - 8;
1413           /* each *s can expand to 4 chars + "...\0",
1414              i.e. need room for 8 chars */
1415         
1416           const char *s, *end;
1417           for (s = SvPVX_const(sv), end = s + SvCUR(sv); s < end && d < limit;
1418                s++) {
1419                int ch = *s & 0xFF;
1420                if (ch & 128 && !isPRINT_LC(ch)) {
1421                     *d++ = 'M';
1422                     *d++ = '-';
1423                     ch &= 127;
1424                }
1425                if (ch == '\n') {
1426                     *d++ = '\\';
1427                     *d++ = 'n';
1428                }
1429                else if (ch == '\r') {
1430                     *d++ = '\\';
1431                     *d++ = 'r';
1432                }
1433                else if (ch == '\f') {
1434                     *d++ = '\\';
1435                     *d++ = 'f';
1436                }
1437                else if (ch == '\\') {
1438                     *d++ = '\\';
1439                     *d++ = '\\';
1440                }
1441                else if (ch == '\0') {
1442                     *d++ = '\\';
1443                     *d++ = '0';
1444                }
1445                else if (isPRINT_LC(ch))
1446                     *d++ = ch;
1447                else {
1448                     *d++ = '^';
1449                     *d++ = toCTRL(ch);
1450                }
1451           }
1452           if (s < end) {
1453                *d++ = '.';
1454                *d++ = '.';
1455                *d++ = '.';
1456           }
1457           *d = '\0';
1458           pv = tmpbuf;
1459     }
1460
1461     if (PL_op)
1462         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1463                     "Argument \"%s\" isn't numeric in %s", pv,
1464                     OP_DESC(PL_op));
1465     else
1466         Perl_warner(aTHX_ packWARN(WARN_NUMERIC),
1467                     "Argument \"%s\" isn't numeric", pv);
1468 }
1469
1470 /*
1471 =for apidoc looks_like_number
1472
1473 Test if the content of an SV looks like a number (or is a number).
1474 C<Inf> and C<Infinity> are treated as numbers (so will not issue a
1475 non-numeric warning), even if your atof() doesn't grok them.
1476
1477 =cut
1478 */
1479
1480 I32
1481 Perl_looks_like_number(pTHX_ SV *sv)
1482 {
1483     register const char *sbegin;
1484     STRLEN len;
1485
1486     if (SvPOK(sv)) {
1487         sbegin = SvPVX_const(sv);
1488         len = SvCUR(sv);
1489     }
1490     else if (SvPOKp(sv))
1491         sbegin = SvPV_const(sv, len);
1492     else
1493         return SvFLAGS(sv) & (SVf_NOK|SVp_NOK|SVf_IOK|SVp_IOK);
1494     return grok_number(sbegin, len, NULL);
1495 }
1496
1497 /* Actually, ISO C leaves conversion of UV to IV undefined, but
1498    until proven guilty, assume that things are not that bad... */
1499
1500 /*
1501    NV_PRESERVES_UV:
1502
1503    As 64 bit platforms often have an NV that doesn't preserve all bits of
1504    an IV (an assumption perl has been based on to date) it becomes necessary
1505    to remove the assumption that the NV always carries enough precision to
1506    recreate the IV whenever needed, and that the NV is the canonical form.
1507    Instead, IV/UV and NV need to be given equal rights. So as to not lose
1508    precision as a side effect of conversion (which would lead to insanity
1509    and the dragon(s) in t/op/numconvert.t getting very angry) the intent is
1510    1) to distinguish between IV/UV/NV slots that have cached a valid
1511       conversion where precision was lost and IV/UV/NV slots that have a
1512       valid conversion which has lost no precision
1513    2) to ensure that if a numeric conversion to one form is requested that
1514       would lose precision, the precise conversion (or differently
1515       imprecise conversion) is also performed and cached, to prevent
1516       requests for different numeric formats on the same SV causing
1517       lossy conversion chains. (lossless conversion chains are perfectly
1518       acceptable (still))
1519
1520
1521    flags are used:
1522    SvIOKp is true if the IV slot contains a valid value
1523    SvIOK  is true only if the IV value is accurate (UV if SvIOK_UV true)
1524    SvNOKp is true if the NV slot contains a valid value
1525    SvNOK  is true only if the NV value is accurate
1526
1527    so
1528    while converting from PV to NV, check to see if converting that NV to an
1529    IV(or UV) would lose accuracy over a direct conversion from PV to
1530    IV(or UV). If it would, cache both conversions, return NV, but mark
1531    SV as IOK NOKp (ie not NOK).
1532
1533    While converting from PV to IV, check to see if converting that IV to an
1534    NV would lose accuracy over a direct conversion from PV to NV. If it
1535    would, cache both conversions, flag similarly.
1536
1537    Before, the SV value "3.2" could become NV=3.2 IV=3 NOK, IOK quite
1538    correctly because if IV & NV were set NV *always* overruled.
1539    Now, "3.2" will become NV=3.2 IV=3 NOK, IOKp, because the flag's meaning
1540    changes - now IV and NV together means that the two are interchangeable:
1541    SvIVX == (IV) SvNVX && SvNVX == (NV) SvIVX;
1542
1543    The benefit of this is that operations such as pp_add know that if
1544    SvIOK is true for both left and right operands, then integer addition
1545    can be used instead of floating point (for cases where the result won't
1546    overflow). Before, floating point was always used, which could lead to
1547    loss of precision compared with integer addition.
1548
1549    * making IV and NV equal status should make maths accurate on 64 bit
1550      platforms
1551    * may speed up maths somewhat if pp_add and friends start to use
1552      integers when possible instead of fp. (Hopefully the overhead in
1553      looking for SvIOK and checking for overflow will not outweigh the
1554      fp to integer speedup)
1555    * will slow down integer operations (callers of SvIV) on "inaccurate"
1556      values, as the change from SvIOK to SvIOKp will cause a call into
1557      sv_2iv each time rather than a macro access direct to the IV slot
1558    * should speed up number->string conversion on integers as IV is
1559      favoured when IV and NV are equally accurate
1560
1561    ####################################################################
1562    You had better be using SvIOK_notUV if you want an IV for arithmetic:
1563    SvIOK is true if (IV or UV), so you might be getting (IV)SvUV.
1564    On the other hand, SvUOK is true iff UV.
1565    ####################################################################
1566
1567    Your mileage will vary depending your CPU's relative fp to integer
1568    performance ratio.
1569 */
1570
1571 #ifndef NV_PRESERVES_UV
1572 #  define IS_NUMBER_UNDERFLOW_IV 1
1573 #  define IS_NUMBER_UNDERFLOW_UV 2
1574 #  define IS_NUMBER_IV_AND_UV    2
1575 #  define IS_NUMBER_OVERFLOW_IV  4
1576 #  define IS_NUMBER_OVERFLOW_UV  5
1577
1578 /* sv_2iuv_non_preserve(): private routine for use by sv_2iv() and sv_2uv() */
1579
1580 /* For sv_2nv these three cases are "SvNOK and don't bother casting"  */
1581 STATIC int
1582 S_sv_2iuv_non_preserve(pTHX_ register SV *sv, I32 numtype)
1583 {
1584     DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_2iuv_non '%s', IV=0x%"UVxf" NV=%"NVgf" inttype=%"UVXf"\n", SvPVX_const(sv), SvIVX(sv), SvNVX(sv), (UV)numtype));
1585     if (SvNVX(sv) < (NV)IV_MIN) {
1586         (void)SvIOKp_on(sv);
1587         (void)SvNOK_on(sv);
1588         SvIV_set(sv, IV_MIN);
1589         return IS_NUMBER_UNDERFLOW_IV;
1590     }
1591     if (SvNVX(sv) > (NV)UV_MAX) {
1592         (void)SvIOKp_on(sv);
1593         (void)SvNOK_on(sv);
1594         SvIsUV_on(sv);
1595         SvUV_set(sv, UV_MAX);
1596         return IS_NUMBER_OVERFLOW_UV;
1597     }
1598     (void)SvIOKp_on(sv);
1599     (void)SvNOK_on(sv);
1600     /* Can't use strtol etc to convert this string.  (See truth table in
1601        sv_2iv  */
1602     if (SvNVX(sv) <= (UV)IV_MAX) {
1603         SvIV_set(sv, I_V(SvNVX(sv)));
1604         if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1605             SvIOK_on(sv); /* Integer is precise. NOK, IOK */
1606         } else {
1607             /* Integer is imprecise. NOK, IOKp */
1608         }
1609         return SvNVX(sv) < 0 ? IS_NUMBER_UNDERFLOW_UV : IS_NUMBER_IV_AND_UV;
1610     }
1611     SvIsUV_on(sv);
1612     SvUV_set(sv, U_V(SvNVX(sv)));
1613     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1614         if (SvUVX(sv) == UV_MAX) {
1615             /* As we know that NVs don't preserve UVs, UV_MAX cannot
1616                possibly be preserved by NV. Hence, it must be overflow.
1617                NOK, IOKp */
1618             return IS_NUMBER_OVERFLOW_UV;
1619         }
1620         SvIOK_on(sv); /* Integer is precise. NOK, UOK */
1621     } else {
1622         /* Integer is imprecise. NOK, IOKp */
1623     }
1624     return IS_NUMBER_OVERFLOW_IV;
1625 }
1626 #endif /* !NV_PRESERVES_UV*/
1627
1628 STATIC bool
1629 S_sv_2iuv_common(pTHX_ SV *sv) {
1630     if (SvNOKp(sv)) {
1631         /* erm. not sure. *should* never get NOKp (without NOK) from sv_2nv
1632          * without also getting a cached IV/UV from it at the same time
1633          * (ie PV->NV conversion should detect loss of accuracy and cache
1634          * IV or UV at same time to avoid this. */
1635         /* IV-over-UV optimisation - choose to cache IV if possible */
1636
1637         if (SvTYPE(sv) == SVt_NV)
1638             sv_upgrade(sv, SVt_PVNV);
1639
1640         (void)SvIOKp_on(sv);    /* Must do this first, to clear any SvOOK */
1641         /* < not <= as for NV doesn't preserve UV, ((NV)IV_MAX+1) will almost
1642            certainly cast into the IV range at IV_MAX, whereas the correct
1643            answer is the UV IV_MAX +1. Hence < ensures that dodgy boundary
1644            cases go to UV */
1645         if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1646             SvIV_set(sv, I_V(SvNVX(sv)));
1647             if (SvNVX(sv) == (NV) SvIVX(sv)
1648 #ifndef NV_PRESERVES_UV
1649                 && (((UV)1 << NV_PRESERVES_UV_BITS) >
1650                     (UV)(SvIVX(sv) > 0 ? SvIVX(sv) : -SvIVX(sv)))
1651                 /* Don't flag it as "accurately an integer" if the number
1652                    came from a (by definition imprecise) NV operation, and
1653                    we're outside the range of NV integer precision */
1654 #endif
1655                 ) {
1656                 SvIOK_on(sv);  /* Can this go wrong with rounding? NWC */
1657                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1658                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (precise)\n",
1659                                       PTR2UV(sv),
1660                                       SvNVX(sv),
1661                                       SvIVX(sv)));
1662
1663             } else {
1664                 /* IV not precise.  No need to convert from PV, as NV
1665                    conversion would already have cached IV if it detected
1666                    that PV->IV would be better than PV->NV->IV
1667                    flags already correct - don't set public IOK.  */
1668                 DEBUG_c(PerlIO_printf(Perl_debug_log,
1669                                       "0x%"UVxf" iv(%"NVgf" => %"IVdf") (imprecise)\n",
1670                                       PTR2UV(sv),
1671                                       SvNVX(sv),
1672                                       SvIVX(sv)));
1673             }
1674             /* Can the above go wrong if SvIVX == IV_MIN and SvNVX < IV_MIN,
1675                but the cast (NV)IV_MIN rounds to a the value less (more
1676                negative) than IV_MIN which happens to be equal to SvNVX ??
1677                Analogous to 0xFFFFFFFFFFFFFFFF rounding up to NV (2**64) and
1678                NV rounding back to 0xFFFFFFFFFFFFFFFF, so UVX == UV(NVX) and
1679                (NV)UVX == NVX are both true, but the values differ. :-(
1680                Hopefully for 2s complement IV_MIN is something like
1681                0x8000000000000000 which will be exact. NWC */
1682         }
1683         else {
1684             SvUV_set(sv, U_V(SvNVX(sv)));
1685             if (
1686                 (SvNVX(sv) == (NV) SvUVX(sv))
1687 #ifndef  NV_PRESERVES_UV
1688                 /* Make sure it's not 0xFFFFFFFFFFFFFFFF */
1689                 /*&& (SvUVX(sv) != UV_MAX) irrelevant with code below */
1690                 && (((UV)1 << NV_PRESERVES_UV_BITS) > SvUVX(sv))
1691                 /* Don't flag it as "accurately an integer" if the number
1692                    came from a (by definition imprecise) NV operation, and
1693                    we're outside the range of NV integer precision */
1694 #endif
1695                 )
1696                 SvIOK_on(sv);
1697             SvIsUV_on(sv);
1698             DEBUG_c(PerlIO_printf(Perl_debug_log,
1699                                   "0x%"UVxf" 2iv(%"UVuf" => %"IVdf") (as unsigned)\n",
1700                                   PTR2UV(sv),
1701                                   SvUVX(sv),
1702                                   SvUVX(sv)));
1703         }
1704     }
1705     else if (SvPOKp(sv) && SvLEN(sv)) {
1706         UV value;
1707         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
1708         /* We want to avoid a possible problem when we cache an IV/ a UV which
1709            may be later translated to an NV, and the resulting NV is not
1710            the same as the direct translation of the initial string
1711            (eg 123.456 can shortcut to the IV 123 with atol(), but we must
1712            be careful to ensure that the value with the .456 is around if the
1713            NV value is requested in the future).
1714         
1715            This means that if we cache such an IV/a UV, we need to cache the
1716            NV as well.  Moreover, we trade speed for space, and do not
1717            cache the NV if we are sure it's not needed.
1718          */
1719
1720         /* SVt_PVNV is one higher than SVt_PVIV, hence this order  */
1721         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1722              == IS_NUMBER_IN_UV) {
1723             /* It's definitely an integer, only upgrade to PVIV */
1724             if (SvTYPE(sv) < SVt_PVIV)
1725                 sv_upgrade(sv, SVt_PVIV);
1726             (void)SvIOK_on(sv);
1727         } else if (SvTYPE(sv) < SVt_PVNV)
1728             sv_upgrade(sv, SVt_PVNV);
1729
1730         /* If NV preserves UV then we only use the UV value if we know that
1731            we aren't going to call atof() below. If NVs don't preserve UVs
1732            then the value returned may have more precision than atof() will
1733            return, even though value isn't perfectly accurate.  */
1734         if ((numtype & (IS_NUMBER_IN_UV
1735 #ifdef NV_PRESERVES_UV
1736                         | IS_NUMBER_NOT_INT
1737 #endif
1738             )) == IS_NUMBER_IN_UV) {
1739             /* This won't turn off the public IOK flag if it was set above  */
1740             (void)SvIOKp_on(sv);
1741
1742             if (!(numtype & IS_NUMBER_NEG)) {
1743                 /* positive */;
1744                 if (value <= (UV)IV_MAX) {
1745                     SvIV_set(sv, (IV)value);
1746                 } else {
1747                     /* it didn't overflow, and it was positive. */
1748                     SvUV_set(sv, value);
1749                     SvIsUV_on(sv);
1750                 }
1751             } else {
1752                 /* 2s complement assumption  */
1753                 if (value <= (UV)IV_MIN) {
1754                     SvIV_set(sv, -(IV)value);
1755                 } else {
1756                     /* Too negative for an IV.  This is a double upgrade, but
1757                        I'm assuming it will be rare.  */
1758                     if (SvTYPE(sv) < SVt_PVNV)
1759                         sv_upgrade(sv, SVt_PVNV);
1760                     SvNOK_on(sv);
1761                     SvIOK_off(sv);
1762                     SvIOKp_on(sv);
1763                     SvNV_set(sv, -(NV)value);
1764                     SvIV_set(sv, IV_MIN);
1765                 }
1766             }
1767         }
1768         /* For !NV_PRESERVES_UV and IS_NUMBER_IN_UV and IS_NUMBER_NOT_INT we
1769            will be in the previous block to set the IV slot, and the next
1770            block to set the NV slot.  So no else here.  */
1771         
1772         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1773             != IS_NUMBER_IN_UV) {
1774             /* It wasn't an (integer that doesn't overflow the UV). */
1775             SvNV_set(sv, Atof(SvPVX_const(sv)));
1776
1777             if (! numtype && ckWARN(WARN_NUMERIC))
1778                 not_a_number(sv);
1779
1780 #if defined(USE_LONG_DOUBLE)
1781             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%" PERL_PRIgldbl ")\n",
1782                                   PTR2UV(sv), SvNVX(sv)));
1783 #else
1784             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"NVgf")\n",
1785                                   PTR2UV(sv), SvNVX(sv)));
1786 #endif
1787
1788 #ifdef NV_PRESERVES_UV
1789             (void)SvIOKp_on(sv);
1790             (void)SvNOK_on(sv);
1791             if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
1792                 SvIV_set(sv, I_V(SvNVX(sv)));
1793                 if ((NV)(SvIVX(sv)) == SvNVX(sv)) {
1794                     SvIOK_on(sv);
1795                 } else {
1796                     /* Integer is imprecise. NOK, IOKp */
1797                 }
1798                 /* UV will not work better than IV */
1799             } else {
1800                 if (SvNVX(sv) > (NV)UV_MAX) {
1801                     SvIsUV_on(sv);
1802                     /* Integer is inaccurate. NOK, IOKp, is UV */
1803                     SvUV_set(sv, UV_MAX);
1804                 } else {
1805                     SvUV_set(sv, U_V(SvNVX(sv)));
1806                     /* 0xFFFFFFFFFFFFFFFF not an issue in here, NVs
1807                        NV preservse UV so can do correct comparison.  */
1808                     if ((NV)(SvUVX(sv)) == SvNVX(sv)) {
1809                         SvIOK_on(sv);
1810                     } else {
1811                         /* Integer is imprecise. NOK, IOKp, is UV */
1812                     }
1813                 }
1814                 SvIsUV_on(sv);
1815             }
1816 #else /* NV_PRESERVES_UV */
1817             if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
1818                 == (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT)) {
1819                 /* The IV/UV slot will have been set from value returned by
1820                    grok_number above.  The NV slot has just been set using
1821                    Atof.  */
1822                 SvNOK_on(sv);
1823                 assert (SvIOKp(sv));
1824             } else {
1825                 if (((UV)1 << NV_PRESERVES_UV_BITS) >
1826                     U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
1827                     /* Small enough to preserve all bits. */
1828                     (void)SvIOKp_on(sv);
1829                     SvNOK_on(sv);
1830                     SvIV_set(sv, I_V(SvNVX(sv)));
1831                     if ((NV)(SvIVX(sv)) == SvNVX(sv))
1832                         SvIOK_on(sv);
1833                     /* Assumption: first non-preserved integer is < IV_MAX,
1834                        this NV is in the preserved range, therefore: */
1835                     if (!(U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))
1836                           < (UV)IV_MAX)) {
1837                         Perl_croak(aTHX_ "sv_2iv assumed (U_V(fabs((double)SvNVX(sv))) < (UV)IV_MAX) but SvNVX(sv)=%"NVgf" U_V is 0x%"UVxf", IV_MAX is 0x%"UVxf"\n", SvNVX(sv), U_V(SvNVX(sv)), (UV)IV_MAX);
1838                     }
1839                 } else {
1840                     /* IN_UV NOT_INT
1841                          0      0       already failed to read UV.
1842                          0      1       already failed to read UV.
1843                          1      0       you won't get here in this case. IV/UV
1844                                         slot set, public IOK, Atof() unneeded.
1845                          1      1       already read UV.
1846                        so there's no point in sv_2iuv_non_preserve() attempting
1847                        to use atol, strtol, strtoul etc.  */
1848                     sv_2iuv_non_preserve (sv, numtype);
1849                 }
1850             }
1851 #endif /* NV_PRESERVES_UV */
1852         }
1853     }
1854     else  {
1855         if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1856             if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1857                 report_uninit(sv);
1858         }
1859         if (SvTYPE(sv) < SVt_IV)
1860             /* Typically the caller expects that sv_any is not NULL now.  */
1861             sv_upgrade(sv, SVt_IV);
1862         /* Return 0 from the caller.  */
1863         return TRUE;
1864     }
1865     return FALSE;
1866 }
1867
1868 /*
1869 =for apidoc sv_2iv_flags
1870
1871 Return the integer value of an SV, doing any necessary string
1872 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1873 Normally used via the C<SvIV(sv)> and C<SvIVx(sv)> macros.
1874
1875 =cut
1876 */
1877
1878 IV
1879 Perl_sv_2iv_flags(pTHX_ register SV *sv, I32 flags)
1880 {
1881     if (!sv)
1882         return 0;
1883     if (SvGMAGICAL(sv)) {
1884         if (flags & SV_GMAGIC)
1885             mg_get(sv);
1886         if (SvIOKp(sv))
1887             return SvIVX(sv);
1888         if (SvNOKp(sv)) {
1889             return I_V(SvNVX(sv));
1890         }
1891         if (SvPOKp(sv) && SvLEN(sv))
1892             return asIV(sv);
1893         if (!SvROK(sv)) {
1894             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1895                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1896                     report_uninit(sv);
1897             }
1898             return 0;
1899         }
1900     }
1901     if (SvTHINKFIRST(sv)) {
1902         if (SvROK(sv)) {
1903             if (SvAMAGIC(sv)) {
1904                 SV * const tmpstr=AMG_CALLun(sv,numer);
1905                 if (tmpstr && (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
1906                     return SvIV(tmpstr);
1907                 }
1908             }
1909             return PTR2IV(SvRV(sv));
1910         }
1911         if (SvIsCOW(sv)) {
1912             sv_force_normal_flags(sv, 0);
1913         }
1914         if (SvREADONLY(sv) && !SvOK(sv)) {
1915             if (ckWARN(WARN_UNINITIALIZED))
1916                 report_uninit(sv);
1917             return 0;
1918         }
1919     }
1920     if (!SvIOKp(sv)) {
1921         if (S_sv_2iuv_common(aTHX_ sv))
1922             return 0;
1923     }
1924     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2iv(%"IVdf")\n",
1925         PTR2UV(sv),SvIVX(sv)));
1926     return SvIsUV(sv) ? (IV)SvUVX(sv) : SvIVX(sv);
1927 }
1928
1929 /*
1930 =for apidoc sv_2uv_flags
1931
1932 Return the unsigned integer value of an SV, doing any necessary string
1933 conversion.  If flags includes SV_GMAGIC, does an mg_get() first.
1934 Normally used via the C<SvUV(sv)> and C<SvUVx(sv)> macros.
1935
1936 =cut
1937 */
1938
1939 UV
1940 Perl_sv_2uv_flags(pTHX_ register SV *sv, I32 flags)
1941 {
1942     if (!sv)
1943         return 0;
1944     if (SvGMAGICAL(sv)) {
1945         if (flags & SV_GMAGIC)
1946             mg_get(sv);
1947         if (SvIOKp(sv))
1948             return SvUVX(sv);
1949         if (SvNOKp(sv))
1950             return U_V(SvNVX(sv));
1951         if (SvPOKp(sv) && SvLEN(sv))
1952             return asUV(sv);
1953         if (!SvROK(sv)) {
1954             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
1955                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
1956                     report_uninit(sv);
1957             }
1958             return 0;
1959         }
1960     }
1961     if (SvTHINKFIRST(sv)) {
1962         if (SvROK(sv)) {
1963           SV* tmpstr;
1964           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
1965                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
1966               return SvUV(tmpstr);
1967           return PTR2UV(SvRV(sv));
1968         }
1969         if (SvIsCOW(sv)) {
1970             sv_force_normal_flags(sv, 0);
1971         }
1972         if (SvREADONLY(sv) && !SvOK(sv)) {
1973             if (ckWARN(WARN_UNINITIALIZED))
1974                 report_uninit(sv);
1975             return 0;
1976         }
1977     }
1978     if (!SvIOKp(sv)) {
1979         if (S_sv_2iuv_common(aTHX_ sv))
1980             return 0;
1981     }
1982
1983     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2uv(%"UVuf")\n",
1984                           PTR2UV(sv),SvUVX(sv)));
1985     return SvIsUV(sv) ? SvUVX(sv) : (UV)SvIVX(sv);
1986 }
1987
1988 /*
1989 =for apidoc sv_2nv
1990
1991 Return the num value of an SV, doing any necessary string or integer
1992 conversion, magic etc. Normally used via the C<SvNV(sv)> and C<SvNVx(sv)>
1993 macros.
1994
1995 =cut
1996 */
1997
1998 NV
1999 Perl_sv_2nv(pTHX_ register SV *sv)
2000 {
2001     if (!sv)
2002         return 0.0;
2003     if (SvGMAGICAL(sv)) {
2004         mg_get(sv);
2005         if (SvNOKp(sv))
2006             return SvNVX(sv);
2007         if (SvPOKp(sv) && SvLEN(sv)) {
2008             if (!SvIOKp(sv) && ckWARN(WARN_NUMERIC) &&
2009                 !grok_number(SvPVX_const(sv), SvCUR(sv), NULL))
2010                 not_a_number(sv);
2011             return Atof(SvPVX_const(sv));
2012         }
2013         if (SvIOKp(sv)) {
2014             if (SvIsUV(sv))
2015                 return (NV)SvUVX(sv);
2016             else
2017                 return (NV)SvIVX(sv);
2018         }       
2019         if (!SvROK(sv)) {
2020             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2021                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2022                     report_uninit(sv);
2023             }
2024             return (NV)0;
2025         }
2026     }
2027     if (SvTHINKFIRST(sv)) {
2028         if (SvROK(sv)) {
2029           SV* tmpstr;
2030           if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,numer)) &&
2031                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv))))
2032               return SvNV(tmpstr);
2033           return PTR2NV(SvRV(sv));
2034         }
2035         if (SvIsCOW(sv)) {
2036             sv_force_normal_flags(sv, 0);
2037         }
2038         if (SvREADONLY(sv) && !SvOK(sv)) {
2039             if (ckWARN(WARN_UNINITIALIZED))
2040                 report_uninit(sv);
2041             return 0.0;
2042         }
2043     }
2044     if (SvTYPE(sv) < SVt_NV) {
2045         if (SvTYPE(sv) == SVt_IV)
2046             sv_upgrade(sv, SVt_PVNV);
2047         else
2048             sv_upgrade(sv, SVt_NV);
2049 #ifdef USE_LONG_DOUBLE
2050         DEBUG_c({
2051             STORE_NUMERIC_LOCAL_SET_STANDARD();
2052             PerlIO_printf(Perl_debug_log,
2053                           "0x%"UVxf" num(%" PERL_PRIgldbl ")\n",
2054                           PTR2UV(sv), SvNVX(sv));
2055             RESTORE_NUMERIC_LOCAL();
2056         });
2057 #else
2058         DEBUG_c({
2059             STORE_NUMERIC_LOCAL_SET_STANDARD();
2060             PerlIO_printf(Perl_debug_log, "0x%"UVxf" num(%"NVgf")\n",
2061                           PTR2UV(sv), SvNVX(sv));
2062             RESTORE_NUMERIC_LOCAL();
2063         });
2064 #endif
2065     }
2066     else if (SvTYPE(sv) < SVt_PVNV)
2067         sv_upgrade(sv, SVt_PVNV);
2068     if (SvNOKp(sv)) {
2069         return SvNVX(sv);
2070     }
2071     if (SvIOKp(sv)) {
2072         SvNV_set(sv, SvIsUV(sv) ? (NV)SvUVX(sv) : (NV)SvIVX(sv));
2073 #ifdef NV_PRESERVES_UV
2074         SvNOK_on(sv);
2075 #else
2076         /* Only set the public NV OK flag if this NV preserves the IV  */
2077         /* Check it's not 0xFFFFFFFFFFFFFFFF */
2078         if (SvIsUV(sv) ? ((SvUVX(sv) != UV_MAX)&&(SvUVX(sv) == U_V(SvNVX(sv))))
2079                        : (SvIVX(sv) == I_V(SvNVX(sv))))
2080             SvNOK_on(sv);
2081         else
2082             SvNOKp_on(sv);
2083 #endif
2084     }
2085     else if (SvPOKp(sv) && SvLEN(sv)) {
2086         UV value;
2087         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2088         if (!SvIOKp(sv) && !numtype && ckWARN(WARN_NUMERIC))
2089             not_a_number(sv);
2090 #ifdef NV_PRESERVES_UV
2091         if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2092             == IS_NUMBER_IN_UV) {
2093             /* It's definitely an integer */
2094             SvNV_set(sv, (numtype & IS_NUMBER_NEG) ? -(NV)value : (NV)value);
2095         } else
2096             SvNV_set(sv, Atof(SvPVX_const(sv)));
2097         SvNOK_on(sv);
2098 #else
2099         SvNV_set(sv, Atof(SvPVX_const(sv)));
2100         /* Only set the public NV OK flag if this NV preserves the value in
2101            the PV at least as well as an IV/UV would.
2102            Not sure how to do this 100% reliably. */
2103         /* if that shift count is out of range then Configure's test is
2104            wonky. We shouldn't be in here with NV_PRESERVES_UV_BITS ==
2105            UV_BITS */
2106         if (((UV)1 << NV_PRESERVES_UV_BITS) >
2107             U_V(SvNVX(sv) > 0 ? SvNVX(sv) : -SvNVX(sv))) {
2108             SvNOK_on(sv); /* Definitely small enough to preserve all bits */
2109         } else if (!(numtype & IS_NUMBER_IN_UV)) {
2110             /* Can't use strtol etc to convert this string, so don't try.
2111                sv_2iv and sv_2uv will use the NV to convert, not the PV.  */
2112             SvNOK_on(sv);
2113         } else {
2114             /* value has been set.  It may not be precise.  */
2115             if ((numtype & IS_NUMBER_NEG) && (value > (UV)IV_MIN)) {
2116                 /* 2s complement assumption for (UV)IV_MIN  */
2117                 SvNOK_on(sv); /* Integer is too negative.  */
2118             } else {
2119                 SvNOKp_on(sv);
2120                 SvIOKp_on(sv);
2121
2122                 if (numtype & IS_NUMBER_NEG) {
2123                     SvIV_set(sv, -(IV)value);
2124                 } else if (value <= (UV)IV_MAX) {
2125                     SvIV_set(sv, (IV)value);
2126                 } else {
2127                     SvUV_set(sv, value);
2128                     SvIsUV_on(sv);
2129                 }
2130
2131                 if (numtype & IS_NUMBER_NOT_INT) {
2132                     /* I believe that even if the original PV had decimals,
2133                        they are lost beyond the limit of the FP precision.
2134                        However, neither is canonical, so both only get p
2135                        flags.  NWC, 2000/11/25 */
2136                     /* Both already have p flags, so do nothing */
2137                 } else {
2138                     const NV nv = SvNVX(sv);
2139                     if (SvNVX(sv) < (NV)IV_MAX + 0.5) {
2140                         if (SvIVX(sv) == I_V(nv)) {
2141                             SvNOK_on(sv);
2142                             SvIOK_on(sv);
2143                         } else {
2144                             SvIOK_on(sv);
2145                             /* It had no "." so it must be integer.  */
2146                         }
2147                     } else {
2148                         /* between IV_MAX and NV(UV_MAX).
2149                            Could be slightly > UV_MAX */
2150
2151                         if (numtype & IS_NUMBER_NOT_INT) {
2152                             /* UV and NV both imprecise.  */
2153                         } else {
2154                             const UV nv_as_uv = U_V(nv);
2155
2156                             if (value == nv_as_uv && SvUVX(sv) != UV_MAX) {
2157                                 SvNOK_on(sv);
2158                                 SvIOK_on(sv);
2159                             } else {
2160                                 SvIOK_on(sv);
2161                             }
2162                         }
2163                     }
2164                 }
2165             }
2166         }
2167 #endif /* NV_PRESERVES_UV */
2168     }
2169     else  {
2170         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2171             report_uninit(sv);
2172         if (SvTYPE(sv) < SVt_NV)
2173             /* Typically the caller expects that sv_any is not NULL now.  */
2174             /* XXX Ilya implies that this is a bug in callers that assume this
2175                and ideally should be fixed.  */
2176             sv_upgrade(sv, SVt_NV);
2177         return 0.0;
2178     }
2179 #if defined(USE_LONG_DOUBLE)
2180     DEBUG_c({
2181         STORE_NUMERIC_LOCAL_SET_STANDARD();
2182         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2nv(%" PERL_PRIgldbl ")\n",
2183                       PTR2UV(sv), SvNVX(sv));
2184         RESTORE_NUMERIC_LOCAL();
2185     });
2186 #else
2187     DEBUG_c({
2188         STORE_NUMERIC_LOCAL_SET_STANDARD();
2189         PerlIO_printf(Perl_debug_log, "0x%"UVxf" 1nv(%"NVgf")\n",
2190                       PTR2UV(sv), SvNVX(sv));
2191         RESTORE_NUMERIC_LOCAL();
2192     });
2193 #endif
2194     return SvNVX(sv);
2195 }
2196
2197 /* asIV(): extract an integer from the string value of an SV.
2198  * Caller must validate PVX  */
2199
2200 STATIC IV
2201 S_asIV(pTHX_ SV *sv)
2202 {
2203     UV value;
2204     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2205
2206     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2207         == IS_NUMBER_IN_UV) {
2208         /* It's definitely an integer */
2209         if (numtype & IS_NUMBER_NEG) {
2210             if (value < (UV)IV_MIN)
2211                 return -(IV)value;
2212         } else {
2213             if (value < (UV)IV_MAX)
2214                 return (IV)value;
2215         }
2216     }
2217     if (!numtype) {
2218         if (ckWARN(WARN_NUMERIC))
2219             not_a_number(sv);
2220     }
2221     return I_V(Atof(SvPVX_const(sv)));
2222 }
2223
2224 /* asUV(): extract an unsigned integer from the string value of an SV
2225  * Caller must validate PVX  */
2226
2227 STATIC UV
2228 S_asUV(pTHX_ SV *sv)
2229 {
2230     UV value;
2231     const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), &value);
2232
2233     if ((numtype & (IS_NUMBER_IN_UV | IS_NUMBER_NOT_INT))
2234         == IS_NUMBER_IN_UV) {
2235         /* It's definitely an integer */
2236         if (!(numtype & IS_NUMBER_NEG))
2237             return value;
2238     }
2239     if (!numtype) {
2240         if (ckWARN(WARN_NUMERIC))
2241             not_a_number(sv);
2242     }
2243     return U_V(Atof(SvPVX_const(sv)));
2244 }
2245
2246 /* uiv_2buf(): private routine for use by sv_2pv_flags(): print an IV or
2247  * UV as a string towards the end of buf, and return pointers to start and
2248  * end of it.
2249  *
2250  * We assume that buf is at least TYPE_CHARS(UV) long.
2251  */
2252
2253 static char *
2254 S_uiv_2buf(char *buf, IV iv, UV uv, int is_uv, char **peob)
2255 {
2256     char *ptr = buf + TYPE_CHARS(UV);
2257     char * const ebuf = ptr;
2258     int sign;
2259
2260     if (is_uv)
2261         sign = 0;
2262     else if (iv >= 0) {
2263         uv = iv;
2264         sign = 0;
2265     } else {
2266         uv = -iv;
2267         sign = 1;
2268     }
2269     do {
2270         *--ptr = '0' + (char)(uv % 10);
2271     } while (uv /= 10);
2272     if (sign)
2273         *--ptr = '-';
2274     *peob = ebuf;
2275     return ptr;
2276 }
2277
2278 /* stringify_regexp(): private routine for use by sv_2pv_flags(): converts
2279  * a regexp to its stringified form.
2280  */
2281
2282 static char *
2283 S_stringify_regexp(pTHX_ SV *sv, MAGIC *mg, STRLEN *lp) {
2284     const regexp *re = (regexp *)mg->mg_obj;
2285
2286     if (!mg->mg_ptr) {
2287         const char *fptr = "msix";
2288         char reflags[6];
2289         char ch;
2290         int left = 0;
2291         int right = 4;
2292         char need_newline = 0;
2293         U16 reganch = (U16)((re->reganch & PMf_COMPILETIME) >> 12);
2294
2295         while((ch = *fptr++)) {
2296             if(reganch & 1) {
2297                 reflags[left++] = ch;
2298             }
2299             else {
2300                 reflags[right--] = ch;
2301             }
2302             reganch >>= 1;
2303         }
2304         if(left != 4) {
2305             reflags[left] = '-';
2306             left = 5;
2307         }
2308
2309         mg->mg_len = re->prelen + 4 + left;
2310         /*
2311          * If /x was used, we have to worry about a regex ending with a
2312          * comment later being embedded within another regex. If so, we don't
2313          * want this regex's "commentization" to leak out to the right part of
2314          * the enclosing regex, we must cap it with a newline.
2315          *
2316          * So, if /x was used, we scan backwards from the end of the regex. If
2317          * we find a '#' before we find a newline, we need to add a newline
2318          * ourself. If we find a '\n' first (or if we don't find '#' or '\n'),
2319          * we don't need to add anything.  -jfriedl
2320          */
2321         if (PMf_EXTENDED & re->reganch) {
2322             const char *endptr = re->precomp + re->prelen;
2323             while (endptr >= re->precomp) {
2324                 const char c = *(endptr--);
2325                 if (c == '\n')
2326                     break; /* don't need another */
2327                 if (c == '#') {
2328                     /* we end while in a comment, so we need a newline */
2329                     mg->mg_len++; /* save space for it */
2330                     need_newline = 1; /* note to add it */
2331                     break;
2332                 }
2333             }
2334         }
2335
2336         Newx(mg->mg_ptr, mg->mg_len + 1 + left, char);
2337         mg->mg_ptr[0] = '(';
2338         mg->mg_ptr[1] = '?';
2339         Copy(reflags, mg->mg_ptr+2, left, char);
2340         *(mg->mg_ptr+left+2) = ':';
2341         Copy(re->precomp, mg->mg_ptr+3+left, re->prelen, char);
2342         if (need_newline)
2343             mg->mg_ptr[mg->mg_len - 2] = '\n';
2344         mg->mg_ptr[mg->mg_len - 1] = ')';
2345         mg->mg_ptr[mg->mg_len] = 0;
2346     }
2347     PL_reginterp_cnt += re->program[0].next_off;
2348     
2349     if (re->reganch & ROPT_UTF8)
2350         SvUTF8_on(sv);
2351     else
2352         SvUTF8_off(sv);
2353     if (lp)
2354         *lp = mg->mg_len;
2355     return mg->mg_ptr;
2356 }
2357
2358 /*
2359 =for apidoc sv_2pv_flags
2360
2361 Returns a pointer to the string value of an SV, and sets *lp to its length.
2362 If flags includes SV_GMAGIC, does an mg_get() first. Coerces sv to a string
2363 if necessary.
2364 Normally invoked via the C<SvPV_flags> macro. C<sv_2pv()> and C<sv_2pv_nomg>
2365 usually end up here too.
2366
2367 =cut
2368 */
2369
2370 char *
2371 Perl_sv_2pv_flags(pTHX_ register SV *sv, STRLEN *lp, I32 flags)
2372 {
2373     register char *s;
2374     int olderrno;
2375
2376     if (!sv) {
2377         if (lp)
2378             *lp = 0;
2379         return (char *)"";
2380     }
2381     if (SvGMAGICAL(sv)) {
2382         if (flags & SV_GMAGIC)
2383             mg_get(sv);
2384         if (SvPOKp(sv)) {
2385             if (lp)
2386                 *lp = SvCUR(sv);
2387             if (flags & SV_MUTABLE_RETURN)
2388                 return SvPVX_mutable(sv);
2389             if (flags & SV_CONST_RETURN)
2390                 return (char *)SvPVX_const(sv);
2391             return SvPVX(sv);
2392         }
2393         if (SvIOKp(sv) || SvNOKp(sv)) {
2394             char tbuf[64];  /* Must fit sprintf/Gconvert of longest IV/NV */
2395             STRLEN len;
2396
2397             if (SvIOKp(sv)) {
2398                 len = SvIsUV(sv) ? my_sprintf(tbuf,"%"UVuf, (UV)SvUVX(sv))
2399                     : my_sprintf(tbuf,"%"IVdf, (IV)SvIVX(sv));
2400             } else {
2401                 Gconvert(SvNVX(sv), NV_DIG, 0, tbuf);
2402                 len = strlen(tbuf);
2403             }
2404             if (SvROK(sv)) {    /* XXX Skip this when sv_pvn_force calls */
2405                 /* Sneaky stuff here */
2406                 SV *tsv = newSVpvn(tbuf, len);
2407
2408                 sv_2mortal(tsv);
2409                 if (lp)
2410                     *lp = SvCUR(tsv);
2411                 return SvPVX(tsv);
2412             }
2413             else {
2414                 dVAR;
2415
2416 #ifdef FIXNEGATIVEZERO
2417                 if (len == 2 && tbuf[0] == '-' && tbuf[1] == '0') {
2418                     tbuf[0] = '0';
2419                     tbuf[1] = 0;
2420                     len = 1;
2421                 }
2422 #endif
2423                 SvUPGRADE(sv, SVt_PV);
2424                 if (lp)
2425                     *lp = len;
2426                 s = SvGROW_mutable(sv, len + 1);
2427                 SvCUR_set(sv, len);
2428                 SvPOKp_on(sv);
2429                 return memcpy(s, tbuf, len + 1);
2430             }
2431         }
2432         if (!SvROK(sv)) {
2433             if (!(SvFLAGS(sv) & SVs_PADTMP)) {
2434                 if (!PL_localizing && ckWARN(WARN_UNINITIALIZED))
2435                     report_uninit(sv);
2436             }
2437             if (lp)
2438                 *lp = 0;
2439             return (char *)"";
2440         }
2441     }
2442     if (SvTHINKFIRST(sv)) {
2443         if (SvROK(sv)) {
2444             SV* tmpstr;
2445
2446             if (SvAMAGIC(sv) && (tmpstr=AMG_CALLun(sv,string)) &&
2447                 (!SvROK(tmpstr) || (SvRV(tmpstr) != SvRV(sv)))) {
2448                 /* Unwrap this:  */
2449                 /* char *pv = lp ? SvPV(tmpstr, *lp) : SvPV_nolen(tmpstr); */
2450
2451                 char *pv;
2452                 if ((SvFLAGS(tmpstr) & (SVf_POK)) == SVf_POK) {
2453                     if (flags & SV_CONST_RETURN) {
2454                         pv = (char *) SvPVX_const(tmpstr);
2455                     } else {
2456                         pv = (flags & SV_MUTABLE_RETURN)
2457                             ? SvPVX_mutable(tmpstr) : SvPVX(tmpstr);
2458                     }
2459                     if (lp)
2460                         *lp = SvCUR(tmpstr);
2461                 } else {
2462                     pv = sv_2pv_flags(tmpstr, lp, flags);
2463                 }
2464                 if (SvUTF8(tmpstr))
2465                     SvUTF8_on(sv);
2466                 else
2467                     SvUTF8_off(sv);
2468                 return pv;
2469             } else {
2470                 SV *tsv;
2471                 MAGIC *mg;
2472                 const SV *const referent = (SV*)SvRV(sv);
2473
2474                 if (!referent) {
2475                     tsv = sv_2mortal(newSVpvn("NULLREF", 7));
2476                 } else if (SvTYPE(referent) == SVt_PVMG
2477                            && ((SvFLAGS(referent) &
2478                                 (SVs_OBJECT|SVf_OK|SVs_GMG|SVs_SMG|SVs_RMG))
2479                                == (SVs_OBJECT|SVs_SMG))
2480                            && (mg = mg_find(referent, PERL_MAGIC_qr))) {
2481                     return S_stringify_regexp(aTHX_ sv, mg, lp);
2482                 } else {
2483                     const char *const typestr = sv_reftype(referent, 0);
2484
2485                     tsv = sv_newmortal();
2486                     if (SvOBJECT(referent)) {
2487                         const char *const name = HvNAME_get(SvSTASH(referent));
2488                         Perl_sv_setpvf(aTHX_ tsv, "%s=%s(0x%"UVxf")",
2489                                        name ? name : "__ANON__" , typestr,
2490                                        PTR2UV(referent));
2491                     }
2492                     else
2493                         Perl_sv_setpvf(aTHX_ tsv, "%s(0x%"UVxf")", typestr,
2494                                        PTR2UV(referent));
2495                 }
2496                 if (lp)
2497                     *lp = SvCUR(tsv);
2498                 return SvPVX(tsv);
2499             }
2500         }
2501         if (SvREADONLY(sv) && !SvOK(sv)) {
2502             if (ckWARN(WARN_UNINITIALIZED))
2503                 report_uninit(sv);
2504             if (lp)
2505                 *lp = 0;
2506             return (char *)"";
2507         }
2508     }
2509     if (SvIOK(sv) || ((SvIOKp(sv) && !SvNOKp(sv)))) {
2510         /* I'm assuming that if both IV and NV are equally valid then
2511            converting the IV is going to be more efficient */
2512         const U32 isIOK = SvIOK(sv);
2513         const U32 isUIOK = SvIsUV(sv);
2514         char buf[TYPE_CHARS(UV)];
2515         char *ebuf, *ptr;
2516
2517         if (SvTYPE(sv) < SVt_PVIV)
2518             sv_upgrade(sv, SVt_PVIV);
2519         if (isUIOK)
2520             ptr = uiv_2buf(buf, 0, SvUVX(sv), 1, &ebuf);
2521         else
2522             ptr = uiv_2buf(buf, SvIVX(sv), 0, 0, &ebuf);
2523         /* inlined from sv_setpvn */
2524         SvGROW_mutable(sv, (STRLEN)(ebuf - ptr + 1));
2525         Move(ptr,SvPVX_mutable(sv),ebuf - ptr,char);
2526         SvCUR_set(sv, ebuf - ptr);
2527         s = SvEND(sv);
2528         *s = '\0';
2529         if (isIOK)
2530             SvIOK_on(sv);
2531         else
2532             SvIOKp_on(sv);
2533         if (isUIOK)
2534             SvIsUV_on(sv);
2535     }
2536     else if (SvNOKp(sv)) {
2537         if (SvTYPE(sv) < SVt_PVNV)
2538             sv_upgrade(sv, SVt_PVNV);
2539         /* The +20 is pure guesswork.  Configure test needed. --jhi */
2540         s = SvGROW_mutable(sv, NV_DIG + 20);
2541         olderrno = errno;       /* some Xenix systems wipe out errno here */
2542 #ifdef apollo
2543         if (SvNVX(sv) == 0.0)
2544             (void)strcpy(s,"0");
2545         else
2546 #endif /*apollo*/
2547         {
2548             Gconvert(SvNVX(sv), NV_DIG, 0, s);
2549         }
2550         errno = olderrno;
2551 #ifdef FIXNEGATIVEZERO
2552         if (*s == '-' && s[1] == '0' && !s[2])
2553             strcpy(s,"0");
2554 #endif
2555         while (*s) s++;
2556 #ifdef hcx
2557         if (s[-1] == '.')
2558             *--s = '\0';
2559 #endif
2560     }
2561     else {
2562         if (!PL_localizing && !(SvFLAGS(sv) & SVs_PADTMP) && ckWARN(WARN_UNINITIALIZED))
2563             report_uninit(sv);
2564         if (lp)
2565         *lp = 0;
2566         if (SvTYPE(sv) < SVt_PV)
2567             /* Typically the caller expects that sv_any is not NULL now.  */
2568             sv_upgrade(sv, SVt_PV);
2569         return (char *)"";
2570     }
2571     {
2572         const STRLEN len = s - SvPVX_const(sv);
2573         if (lp) 
2574             *lp = len;
2575         SvCUR_set(sv, len);
2576     }
2577     SvPOK_on(sv);
2578     DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
2579                           PTR2UV(sv),SvPVX_const(sv)));
2580     if (flags & SV_CONST_RETURN)
2581         return (char *)SvPVX_const(sv);
2582     if (flags & SV_MUTABLE_RETURN)
2583         return SvPVX_mutable(sv);
2584     return SvPVX(sv);
2585 }
2586
2587 /*
2588 =for apidoc sv_copypv
2589
2590 Copies a stringified representation of the source SV into the
2591 destination SV.  Automatically performs any necessary mg_get and
2592 coercion of numeric values into strings.  Guaranteed to preserve
2593 UTF-8 flag even from overloaded objects.  Similar in nature to
2594 sv_2pv[_flags] but operates directly on an SV instead of just the
2595 string.  Mostly uses sv_2pv_flags to do its work, except when that
2596 would lose the UTF-8'ness of the PV.
2597
2598 =cut
2599 */
2600
2601 void
2602 Perl_sv_copypv(pTHX_ SV *dsv, register SV *ssv)
2603 {
2604     STRLEN len;
2605     const char * const s = SvPV_const(ssv,len);
2606     sv_setpvn(dsv,s,len);
2607     if (SvUTF8(ssv))
2608         SvUTF8_on(dsv);
2609     else
2610         SvUTF8_off(dsv);
2611 }
2612
2613 /*
2614 =for apidoc sv_2pvbyte
2615
2616 Return a pointer to the byte-encoded representation of the SV, and set *lp
2617 to its length.  May cause the SV to be downgraded from UTF-8 as a
2618 side-effect.
2619
2620 Usually accessed via the C<SvPVbyte> macro.
2621
2622 =cut
2623 */
2624
2625 char *
2626 Perl_sv_2pvbyte(pTHX_ register SV *sv, STRLEN *lp)
2627 {
2628     sv_utf8_downgrade(sv,0);
2629     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2630 }
2631
2632 /*
2633 =for apidoc sv_2pvutf8
2634
2635 Return a pointer to the UTF-8-encoded representation of the SV, and set *lp
2636 to its length.  May cause the SV to be upgraded to UTF-8 as a side-effect.
2637
2638 Usually accessed via the C<SvPVutf8> macro.
2639
2640 =cut
2641 */
2642
2643 char *
2644 Perl_sv_2pvutf8(pTHX_ register SV *sv, STRLEN *lp)
2645 {
2646     sv_utf8_upgrade(sv);
2647     return lp ? SvPV(sv,*lp) : SvPV_nolen(sv);
2648 }
2649
2650
2651 /*
2652 =for apidoc sv_2bool
2653
2654 This function is only called on magical items, and is only used by
2655 sv_true() or its macro equivalent.
2656
2657 =cut
2658 */
2659
2660 bool
2661 Perl_sv_2bool(pTHX_ register SV *sv)
2662 {
2663     SvGETMAGIC(sv);
2664
2665     if (!SvOK(sv))
2666         return 0;
2667     if (SvROK(sv)) {
2668         SV* tmpsv;
2669         if (SvAMAGIC(sv) && (tmpsv=AMG_CALLun(sv,bool_)) &&
2670                 (!SvROK(tmpsv) || (SvRV(tmpsv) != SvRV(sv))))
2671             return (bool)SvTRUE(tmpsv);
2672       return SvRV(sv) != 0;
2673     }
2674     if (SvPOKp(sv)) {
2675         register XPV* const Xpvtmp = (XPV*)SvANY(sv);
2676         if (Xpvtmp &&
2677                 (*sv->sv_u.svu_pv > '0' ||
2678                 Xpvtmp->xpv_cur > 1 ||
2679                 (Xpvtmp->xpv_cur && *sv->sv_u.svu_pv != '0')))
2680             return 1;
2681         else
2682             return 0;
2683     }
2684     else {
2685         if (SvIOKp(sv))
2686             return SvIVX(sv) != 0;
2687         else {
2688             if (SvNOKp(sv))
2689                 return SvNVX(sv) != 0.0;
2690             else
2691                 return FALSE;
2692         }
2693     }
2694 }
2695
2696 /*
2697 =for apidoc sv_utf8_upgrade
2698
2699 Converts the PV of an SV to its UTF-8-encoded form.
2700 Forces the SV to string form if it is not already.
2701 Always sets the SvUTF8 flag to avoid future validity checks even
2702 if all the bytes have hibit clear.
2703
2704 This is not as a general purpose byte encoding to Unicode interface:
2705 use the Encode extension for that.
2706
2707 =for apidoc sv_utf8_upgrade_flags
2708
2709 Converts the PV of an SV to its UTF-8-encoded form.
2710 Forces the SV to string form if it is not already.
2711 Always sets the SvUTF8 flag to avoid future validity checks even
2712 if all the bytes have hibit clear. If C<flags> has C<SV_GMAGIC> bit set,
2713 will C<mg_get> on C<sv> if appropriate, else not. C<sv_utf8_upgrade> and
2714 C<sv_utf8_upgrade_nomg> are implemented in terms of this function.
2715
2716 This is not as a general purpose byte encoding to Unicode interface:
2717 use the Encode extension for that.
2718
2719 =cut
2720 */
2721
2722 STRLEN
2723 Perl_sv_utf8_upgrade_flags(pTHX_ register SV *sv, I32 flags)
2724 {
2725     if (sv == &PL_sv_undef)
2726         return 0;
2727     if (!SvPOK(sv)) {
2728         STRLEN len = 0;
2729         if (SvREADONLY(sv) && (SvPOKp(sv) || SvIOKp(sv) || SvNOKp(sv))) {
2730             (void) sv_2pv_flags(sv,&len, flags);
2731             if (SvUTF8(sv))
2732                 return len;
2733         } else {
2734             (void) SvPV_force(sv,len);
2735         }
2736     }
2737
2738     if (SvUTF8(sv)) {
2739         return SvCUR(sv);
2740     }
2741
2742     if (SvIsCOW(sv)) {
2743         sv_force_normal_flags(sv, 0);
2744     }
2745
2746     if (PL_encoding && !(flags & SV_UTF8_NO_ENCODING))
2747         sv_recode_to_utf8(sv, PL_encoding);
2748     else { /* Assume Latin-1/EBCDIC */
2749         /* This function could be much more efficient if we
2750          * had a FLAG in SVs to signal if there are any hibit
2751          * chars in the PV.  Given that there isn't such a flag
2752          * make the loop as fast as possible. */
2753         const U8 *s = (U8 *) SvPVX_const(sv);
2754         const U8 * const e = (U8 *) SvEND(sv);
2755         const U8 *t = s;
2756         int hibit = 0;
2757         
2758         while (t < e) {
2759             const U8 ch = *t++;
2760             if ((hibit = !NATIVE_IS_INVARIANT(ch)))
2761                 break;
2762         }
2763         if (hibit) {
2764             STRLEN len = SvCUR(sv) + 1; /* Plus the \0 */
2765             U8 * const recoded = bytes_to_utf8((U8*)s, &len);
2766
2767             SvPV_free(sv); /* No longer using what was there before. */
2768
2769             SvPV_set(sv, (char*)recoded);
2770             SvCUR_set(sv, len - 1);
2771             SvLEN_set(sv, len); /* No longer know the real size. */
2772         }
2773         /* Mark as UTF-8 even if no hibit - saves scanning loop */
2774         SvUTF8_on(sv);
2775     }
2776     return SvCUR(sv);
2777 }
2778
2779 /*
2780 =for apidoc sv_utf8_downgrade
2781
2782 Attempts to convert the PV of an SV from characters to bytes.
2783 If the PV contains a character beyond byte, this conversion will fail;
2784 in this case, either returns false or, if C<fail_ok> is not
2785 true, croaks.
2786
2787 This is not as a general purpose Unicode to byte encoding interface:
2788 use the Encode extension for that.
2789
2790 =cut
2791 */
2792
2793 bool
2794 Perl_sv_utf8_downgrade(pTHX_ register SV* sv, bool fail_ok)
2795 {
2796     if (SvPOKp(sv) && SvUTF8(sv)) {
2797         if (SvCUR(sv)) {
2798             U8 *s;
2799             STRLEN len;
2800
2801             if (SvIsCOW(sv)) {
2802                 sv_force_normal_flags(sv, 0);
2803             }
2804             s = (U8 *) SvPV(sv, len);
2805             if (!utf8_to_bytes(s, &len)) {
2806                 if (fail_ok)
2807                     return FALSE;
2808                 else {
2809                     if (PL_op)
2810                         Perl_croak(aTHX_ "Wide character in %s",
2811                                    OP_DESC(PL_op));
2812                     else
2813                         Perl_croak(aTHX_ "Wide character");
2814                 }
2815             }
2816             SvCUR_set(sv, len);
2817         }
2818     }
2819     SvUTF8_off(sv);
2820     return TRUE;
2821 }
2822
2823 /*
2824 =for apidoc sv_utf8_encode
2825
2826 Converts the PV of an SV to UTF-8, but then turns the C<SvUTF8>
2827 flag off so that it looks like octets again.
2828
2829 =cut
2830 */
2831
2832 void
2833 Perl_sv_utf8_encode(pTHX_ register SV *sv)
2834 {
2835     (void) sv_utf8_upgrade(sv);
2836     if (SvIsCOW(sv)) {
2837         sv_force_normal_flags(sv, 0);
2838     }
2839     if (SvREADONLY(sv)) {
2840         Perl_croak(aTHX_ PL_no_modify);
2841     }
2842     SvUTF8_off(sv);
2843 }
2844
2845 /*
2846 =for apidoc sv_utf8_decode
2847
2848 If the PV of the SV is an octet sequence in UTF-8
2849 and contains a multiple-byte character, the C<SvUTF8> flag is turned on
2850 so that it looks like a character. If the PV contains only single-byte
2851 characters, the C<SvUTF8> flag stays being off.
2852 Scans PV for validity and returns false if the PV is invalid UTF-8.
2853
2854 =cut
2855 */
2856
2857 bool
2858 Perl_sv_utf8_decode(pTHX_ register SV *sv)
2859 {
2860     if (SvPOKp(sv)) {
2861         const U8 *c;
2862         const U8 *e;
2863
2864         /* The octets may have got themselves encoded - get them back as
2865          * bytes
2866          */
2867         if (!sv_utf8_downgrade(sv, TRUE))
2868             return FALSE;
2869
2870         /* it is actually just a matter of turning the utf8 flag on, but
2871          * we want to make sure everything inside is valid utf8 first.
2872          */
2873         c = (const U8 *) SvPVX_const(sv);
2874         if (!is_utf8_string(c, SvCUR(sv)+1))
2875             return FALSE;
2876         e = (const U8 *) SvEND(sv);
2877         while (c < e) {
2878             const U8 ch = *c++;
2879             if (!UTF8_IS_INVARIANT(ch)) {
2880                 SvUTF8_on(sv);
2881                 break;
2882             }
2883         }
2884     }
2885     return TRUE;
2886 }
2887
2888 /*
2889 =for apidoc sv_setsv
2890
2891 Copies the contents of the source SV C<ssv> into the destination SV
2892 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2893 function if the source SV needs to be reused. Does not handle 'set' magic.
2894 Loosely speaking, it performs a copy-by-value, obliterating any previous
2895 content of the destination.
2896
2897 You probably want to use one of the assortment of wrappers, such as
2898 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2899 C<SvSetMagicSV_nosteal>.
2900
2901 =for apidoc sv_setsv_flags
2902
2903 Copies the contents of the source SV C<ssv> into the destination SV
2904 C<dsv>.  The source SV may be destroyed if it is mortal, so don't use this
2905 function if the source SV needs to be reused. Does not handle 'set' magic.
2906 Loosely speaking, it performs a copy-by-value, obliterating any previous
2907 content of the destination.
2908 If the C<flags> parameter has the C<SV_GMAGIC> bit set, will C<mg_get> on
2909 C<ssv> if appropriate, else not. If the C<flags> parameter has the
2910 C<NOSTEAL> bit set then the buffers of temps will not be stolen. <sv_setsv>
2911 and C<sv_setsv_nomg> are implemented in terms of this function.
2912
2913 You probably want to use one of the assortment of wrappers, such as
2914 C<SvSetSV>, C<SvSetSV_nosteal>, C<SvSetMagicSV> and
2915 C<SvSetMagicSV_nosteal>.
2916
2917 This is the primary function for copying scalars, and most other
2918 copy-ish functions and macros use this underneath.
2919
2920 =cut
2921 */
2922
2923 void
2924 Perl_sv_setsv_flags(pTHX_ SV *dstr, register SV *sstr, I32 flags)
2925 {
2926     register U32 sflags;
2927     register int dtype;
2928     register int stype;
2929
2930     if (sstr == dstr)
2931         return;
2932     SV_CHECK_THINKFIRST_COW_DROP(dstr);
2933     if (!sstr)
2934         sstr = &PL_sv_undef;
2935     stype = SvTYPE(sstr);
2936     dtype = SvTYPE(dstr);
2937
2938     SvAMAGIC_off(dstr);
2939     if ( SvVOK(dstr) )
2940     {
2941         /* need to nuke the magic */
2942         mg_free(dstr);
2943         SvRMAGICAL_off(dstr);
2944     }
2945
2946     /* There's a lot of redundancy below but we're going for speed here */
2947
2948     switch (stype) {
2949     case SVt_NULL:
2950       undef_sstr:
2951         if (dtype != SVt_PVGV) {
2952             (void)SvOK_off(dstr);
2953             return;
2954         }
2955         break;
2956     case SVt_IV:
2957         if (SvIOK(sstr)) {
2958             switch (dtype) {
2959             case SVt_NULL:
2960                 sv_upgrade(dstr, SVt_IV);
2961                 break;
2962             case SVt_NV:
2963                 sv_upgrade(dstr, SVt_PVNV);
2964                 break;
2965             case SVt_RV:
2966             case SVt_PV:
2967                 sv_upgrade(dstr, SVt_PVIV);
2968                 break;
2969             }
2970             (void)SvIOK_only(dstr);
2971             SvIV_set(dstr,  SvIVX(sstr));
2972             if (SvIsUV(sstr))
2973                 SvIsUV_on(dstr);
2974             if (SvTAINTED(sstr))
2975                 SvTAINT(dstr);
2976             return;
2977         }
2978         goto undef_sstr;
2979
2980     case SVt_NV:
2981         if (SvNOK(sstr)) {
2982             switch (dtype) {
2983             case SVt_NULL:
2984             case SVt_IV:
2985                 sv_upgrade(dstr, SVt_NV);
2986                 break;
2987             case SVt_RV:
2988             case SVt_PV:
2989             case SVt_PVIV:
2990                 sv_upgrade(dstr, SVt_PVNV);
2991                 break;
2992             }
2993             SvNV_set(dstr, SvNVX(sstr));
2994             (void)SvNOK_only(dstr);
2995             if (SvTAINTED(sstr))
2996                 SvTAINT(dstr);
2997             return;
2998         }
2999         goto undef_sstr;
3000
3001     case SVt_RV:
3002         if (dtype < SVt_RV)
3003             sv_upgrade(dstr, SVt_RV);
3004         else if (dtype == SVt_PVGV &&
3005                  SvROK(sstr) && SvTYPE(SvRV(sstr)) == SVt_PVGV) {
3006             sstr = SvRV(sstr);
3007             if (sstr == dstr) {
3008                 if (GvIMPORTED(dstr) != GVf_IMPORTED
3009                     && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3010                 {
3011                     GvIMPORTED_on(dstr);
3012                 }
3013                 GvMULTI_on(dstr);
3014                 return;
3015             }
3016             goto glob_assign;
3017         }
3018         break;
3019     case SVt_PVFM:
3020 #ifdef PERL_OLD_COPY_ON_WRITE
3021         if ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS) {
3022             if (dtype < SVt_PVIV)
3023                 sv_upgrade(dstr, SVt_PVIV);
3024             break;
3025         }
3026         /* Fall through */
3027 #endif
3028     case SVt_PV:
3029         if (dtype < SVt_PV)
3030             sv_upgrade(dstr, SVt_PV);
3031         break;
3032     case SVt_PVIV:
3033         if (dtype < SVt_PVIV)
3034             sv_upgrade(dstr, SVt_PVIV);
3035         break;
3036     case SVt_PVNV:
3037         if (dtype < SVt_PVNV)
3038             sv_upgrade(dstr, SVt_PVNV);
3039         break;
3040     case SVt_PVAV:
3041     case SVt_PVHV:
3042     case SVt_PVCV:
3043     case SVt_PVIO:
3044         {
3045         const char * const type = sv_reftype(sstr,0);
3046         if (PL_op)
3047             Perl_croak(aTHX_ "Bizarre copy of %s in %s", type, OP_NAME(PL_op));
3048         else
3049             Perl_croak(aTHX_ "Bizarre copy of %s", type);
3050         }
3051         break;
3052
3053     case SVt_PVGV:
3054         if (dtype <= SVt_PVGV) {
3055   glob_assign:
3056             if (dtype != SVt_PVGV) {
3057                 const char * const name = GvNAME(sstr);
3058                 const STRLEN len = GvNAMELEN(sstr);
3059                 /* don't upgrade SVt_PVLV: it can hold a glob */
3060                 if (dtype != SVt_PVLV)
3061                     sv_upgrade(dstr, SVt_PVGV);
3062                 sv_magic(dstr, dstr, PERL_MAGIC_glob, Nullch, 0);
3063                 GvSTASH(dstr) = GvSTASH(sstr);
3064                 if (GvSTASH(dstr))
3065                     Perl_sv_add_backref(aTHX_ (SV*)GvSTASH(dstr), dstr);
3066                 GvNAME(dstr) = savepvn(name, len);
3067                 GvNAMELEN(dstr) = len;
3068                 SvFAKE_on(dstr);        /* can coerce to non-glob */
3069             }
3070
3071 #ifdef GV_UNIQUE_CHECK
3072                 if (GvUNIQUE((GV*)dstr)) {
3073                     Perl_croak(aTHX_ PL_no_modify);
3074                 }
3075 #endif
3076
3077             (void)SvOK_off(dstr);
3078             GvINTRO_off(dstr);          /* one-shot flag */
3079             gp_free((GV*)dstr);
3080             GvGP(dstr) = gp_ref(GvGP(sstr));
3081             if (SvTAINTED(sstr))
3082                 SvTAINT(dstr);
3083             if (GvIMPORTED(dstr) != GVf_IMPORTED
3084                 && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3085             {
3086                 GvIMPORTED_on(dstr);
3087             }
3088             GvMULTI_on(dstr);
3089             return;
3090         }
3091         /* FALL THROUGH */
3092
3093     default:
3094         if (SvGMAGICAL(sstr) && (flags & SV_GMAGIC)) {
3095             mg_get(sstr);
3096             if ((int)SvTYPE(sstr) != stype) {
3097                 stype = SvTYPE(sstr);
3098                 if (stype == SVt_PVGV && dtype <= SVt_PVGV)
3099                     goto glob_assign;
3100             }
3101         }
3102         if (stype == SVt_PVLV)
3103             SvUPGRADE(dstr, SVt_PVNV);
3104         else
3105             SvUPGRADE(dstr, (U32)stype);
3106     }
3107
3108     sflags = SvFLAGS(sstr);
3109
3110     if (sflags & SVf_ROK) {
3111         if (dtype >= SVt_PV) {
3112             if (dtype == SVt_PVGV) {
3113                 SV * const sref = SvREFCNT_inc(SvRV(sstr));
3114                 SV *dref = 0;
3115                 const int intro = GvINTRO(dstr);
3116
3117 #ifdef GV_UNIQUE_CHECK
3118                 if (GvUNIQUE((GV*)dstr)) {
3119                     Perl_croak(aTHX_ PL_no_modify);
3120                 }
3121 #endif
3122
3123                 if (intro) {
3124                     GvINTRO_off(dstr);  /* one-shot flag */
3125                     GvLINE(dstr) = CopLINE(PL_curcop);
3126                     GvEGV(dstr) = (GV*)dstr;
3127                 }
3128                 GvMULTI_on(dstr);
3129                 switch (SvTYPE(sref)) {
3130                 case SVt_PVAV:
3131                     if (intro)
3132                         SAVEGENERICSV(GvAV(dstr));
3133                     else
3134                         dref = (SV*)GvAV(dstr);
3135                     GvAV(dstr) = (AV*)sref;
3136                     if (!GvIMPORTED_AV(dstr)
3137                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3138                     {
3139                         GvIMPORTED_AV_on(dstr);
3140                     }
3141                     break;
3142                 case SVt_PVHV:
3143                     if (intro)
3144                         SAVEGENERICSV(GvHV(dstr));
3145                     else
3146                         dref = (SV*)GvHV(dstr);
3147                     GvHV(dstr) = (HV*)sref;
3148                     if (!GvIMPORTED_HV(dstr)
3149                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3150                     {
3151                         GvIMPORTED_HV_on(dstr);
3152                     }
3153                     break;
3154                 case SVt_PVCV:
3155                     if (intro) {
3156                         if (GvCVGEN(dstr) && GvCV(dstr) != (CV*)sref) {
3157                             SvREFCNT_dec(GvCV(dstr));
3158                             GvCV(dstr) = Nullcv;
3159                             GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3160                             PL_sub_generation++;
3161                         }
3162                         SAVEGENERICSV(GvCV(dstr));
3163                     }
3164                     else
3165                         dref = (SV*)GvCV(dstr);
3166                     if (GvCV(dstr) != (CV*)sref) {
3167                         CV* const cv = GvCV(dstr);
3168                         if (cv) {
3169                             if (!GvCVGEN((GV*)dstr) &&
3170                                 (CvROOT(cv) || CvXSUB(cv)))
3171                             {
3172                                 /* Redefining a sub - warning is mandatory if
3173                                    it was a const and its value changed. */
3174                                 if (ckWARN(WARN_REDEFINE)
3175                                     || (CvCONST(cv)
3176                                         && (!CvCONST((CV*)sref)
3177                                             || sv_cmp(cv_const_sv(cv),
3178                                                       cv_const_sv((CV*)sref)))))
3179                                 {
3180                                     Perl_warner(aTHX_ packWARN(WARN_REDEFINE),
3181                                         CvCONST(cv)
3182                                         ? "Constant subroutine %s::%s redefined"
3183                                         : "Subroutine %s::%s redefined",
3184                                         HvNAME_get(GvSTASH((GV*)dstr)),
3185                                         GvENAME((GV*)dstr));
3186                                 }
3187                             }
3188                             if (!intro)
3189                                 cv_ckproto(cv, (GV*)dstr,
3190                                            SvPOK(sref)
3191                                            ? SvPVX_const(sref) : Nullch);
3192                         }
3193                         GvCV(dstr) = (CV*)sref;
3194                         GvCVGEN(dstr) = 0; /* Switch off cacheness. */
3195                         GvASSUMECV_on(dstr);
3196                         PL_sub_generation++;
3197                     }
3198                     if (!GvIMPORTED_CV(dstr)
3199                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3200                     {
3201                         GvIMPORTED_CV_on(dstr);
3202                     }
3203                     break;
3204                 case SVt_PVIO:
3205                     if (intro)
3206                         SAVEGENERICSV(GvIOp(dstr));
3207                     else
3208                         dref = (SV*)GvIOp(dstr);
3209                     GvIOp(dstr) = (IO*)sref;
3210                     break;
3211                 case SVt_PVFM:
3212                     if (intro)
3213                         SAVEGENERICSV(GvFORM(dstr));
3214                     else
3215                         dref = (SV*)GvFORM(dstr);
3216                     GvFORM(dstr) = (CV*)sref;
3217                     break;
3218                 default:
3219                     if (intro)
3220                         SAVEGENERICSV(GvSV(dstr));
3221                     else
3222                         dref = (SV*)GvSV(dstr);
3223                     GvSV(dstr) = sref;
3224                     if (!GvIMPORTED_SV(dstr)
3225                         && CopSTASH_ne(PL_curcop, GvSTASH(dstr)))
3226                     {
3227                         GvIMPORTED_SV_on(dstr);
3228                     }
3229                     break;
3230                 }
3231                 if (dref)
3232                     SvREFCNT_dec(dref);
3233                 if (SvTAINTED(sstr))
3234                     SvTAINT(dstr);
3235                 return;
3236             }
3237             if (SvPVX_const(dstr)) {
3238                 SvPV_free(dstr);
3239                 SvLEN_set(dstr, 0);
3240                 SvCUR_set(dstr, 0);
3241             }
3242         }
3243         (void)SvOK_off(dstr);
3244         SvRV_set(dstr, SvREFCNT_inc(SvRV(sstr)));
3245         SvROK_on(dstr);
3246         if (sflags & SVp_NOK) {
3247             SvNOKp_on(dstr);
3248             /* Only set the public OK flag if the source has public OK.  */
3249             if (sflags & SVf_NOK)
3250                 SvFLAGS(dstr) |= SVf_NOK;
3251             SvNV_set(dstr, SvNVX(sstr));
3252         }
3253         if (sflags & SVp_IOK) {
3254             (void)SvIOKp_on(dstr);
3255             if (sflags & SVf_IOK)
3256                 SvFLAGS(dstr) |= SVf_IOK;
3257             if (sflags & SVf_IVisUV)
3258                 SvIsUV_on(dstr);
3259             SvIV_set(dstr, SvIVX(sstr));
3260         }
3261         if (SvAMAGIC(sstr)) {
3262             SvAMAGIC_on(dstr);
3263         }
3264     }
3265     else if (sflags & SVp_POK) {
3266         bool isSwipe = 0;
3267
3268         /*
3269          * Check to see if we can just swipe the string.  If so, it's a
3270          * possible small lose on short strings, but a big win on long ones.
3271          * It might even be a win on short strings if SvPVX_const(dstr)
3272          * has to be allocated and SvPVX_const(sstr) has to be freed.
3273          */
3274
3275         /* Whichever path we take through the next code, we want this true,
3276            and doing it now facilitates the COW check.  */
3277         (void)SvPOK_only(dstr);
3278
3279         if (
3280             /* We're not already COW  */
3281             ((sflags & (SVf_FAKE | SVf_READONLY)) != (SVf_FAKE | SVf_READONLY)
3282 #ifndef PERL_OLD_COPY_ON_WRITE
3283              /* or we are, but dstr isn't a suitable target.  */
3284              || (SvFLAGS(dstr) & CAN_COW_MASK) != CAN_COW_FLAGS
3285 #endif
3286              )
3287             &&
3288             !(isSwipe =
3289                  (sflags & SVs_TEMP) &&   /* slated for free anyway? */
3290                  !(sflags & SVf_OOK) &&   /* and not involved in OOK hack? */
3291                  (!(flags & SV_NOSTEAL)) &&
3292                                         /* and we're allowed to steal temps */
3293                  SvREFCNT(sstr) == 1 &&   /* and no other references to it? */
3294                  SvLEN(sstr)    &&        /* and really is a string */
3295                                 /* and won't be needed again, potentially */
3296               !(PL_op && PL_op->op_type == OP_AASSIGN))
3297 #ifdef PERL_OLD_COPY_ON_WRITE
3298             && !((sflags & CAN_COW_MASK) == CAN_COW_FLAGS
3299                  && (SvFLAGS(dstr) & CAN_COW_MASK) == CAN_COW_FLAGS
3300                  && SvTYPE(sstr) >= SVt_PVIV)
3301 #endif
3302             ) {
3303             /* Failed the swipe test, and it's not a shared hash key either.
3304                Have to copy the string.  */
3305             STRLEN len = SvCUR(sstr);
3306             SvGROW(dstr, len + 1);      /* inlined from sv_setpvn */
3307             Move(SvPVX_const(sstr),SvPVX(dstr),len,char);
3308             SvCUR_set(dstr, len);
3309             *SvEND(dstr) = '\0';
3310         } else {
3311             /* If PERL_OLD_COPY_ON_WRITE is not defined, then isSwipe will always
3312                be true in here.  */
3313             /* Either it's a shared hash key, or it's suitable for
3314                copy-on-write or we can swipe the string.  */
3315             if (DEBUG_C_TEST) {
3316                 PerlIO_printf(Perl_debug_log, "Copy on write: sstr --> dstr\n");
3317                 sv_dump(sstr);
3318                 sv_dump(dstr);
3319             }
3320 #ifdef PERL_OLD_COPY_ON_WRITE
3321             if (!isSwipe) {
3322                 /* I believe I should acquire a global SV mutex if
3323                    it's a COW sv (not a shared hash key) to stop
3324                    it going un copy-on-write.
3325                    If the source SV has gone un copy on write between up there
3326                    and down here, then (assert() that) it is of the correct
3327                    form to make it copy on write again */
3328                 if ((sflags & (SVf_FAKE | SVf_READONLY))
3329                     != (SVf_FAKE | SVf_READONLY)) {
3330                     SvREADONLY_on(sstr);
3331                     SvFAKE_on(sstr);
3332                     /* Make the source SV into a loop of 1.
3333                        (about to become 2) */
3334                     SV_COW_NEXT_SV_SET(sstr, sstr);
3335                 }
3336             }
3337 #endif
3338             /* Initial code is common.  */
3339             if (SvPVX_const(dstr)) {    /* we know that dtype >= SVt_PV */
3340                 SvPV_free(dstr);
3341             }
3342
3343             if (!isSwipe) {
3344                 /* making another shared SV.  */
3345                 STRLEN cur = SvCUR(sstr);
3346                 STRLEN len = SvLEN(sstr);
3347 #ifdef PERL_OLD_COPY_ON_WRITE
3348                 if (len) {
3349                     assert (SvTYPE(dstr) >= SVt_PVIV);
3350                     /* SvIsCOW_normal */
3351                     /* splice us in between source and next-after-source.  */
3352                     SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3353                     SV_COW_NEXT_SV_SET(sstr, dstr);
3354                     SvPV_set(dstr, SvPVX_mutable(sstr));
3355                 } else
3356 #endif
3357                 {
3358                     /* SvIsCOW_shared_hash */
3359                     DEBUG_C(PerlIO_printf(Perl_debug_log,
3360                                           "Copy on write: Sharing hash\n"));
3361
3362                     assert (SvTYPE(dstr) >= SVt_PV);
3363                     SvPV_set(dstr,
3364                              HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)))));
3365                 }
3366                 SvLEN_set(dstr, len);
3367                 SvCUR_set(dstr, cur);
3368                 SvREADONLY_on(dstr);
3369                 SvFAKE_on(dstr);
3370                 /* Relesase a global SV mutex.  */
3371             }
3372             else
3373                 {       /* Passes the swipe test.  */
3374                 SvPV_set(dstr, SvPVX_mutable(sstr));
3375                 SvLEN_set(dstr, SvLEN(sstr));
3376                 SvCUR_set(dstr, SvCUR(sstr));
3377
3378                 SvTEMP_off(dstr);
3379                 (void)SvOK_off(sstr);   /* NOTE: nukes most SvFLAGS on sstr */
3380                 SvPV_set(sstr, Nullch);
3381                 SvLEN_set(sstr, 0);
3382                 SvCUR_set(sstr, 0);
3383                 SvTEMP_off(sstr);
3384             }
3385         }
3386         if (sflags & SVf_UTF8)
3387             SvUTF8_on(dstr);
3388         if (sflags & SVp_NOK) {
3389             SvNOKp_on(dstr);
3390             if (sflags & SVf_NOK)
3391                 SvFLAGS(dstr) |= SVf_NOK;
3392             SvNV_set(dstr, SvNVX(sstr));
3393         }
3394         if (sflags & SVp_IOK) {
3395             (void)SvIOKp_on(dstr);
3396             if (sflags & SVf_IOK)
3397                 SvFLAGS(dstr) |= SVf_IOK;
3398             if (sflags & SVf_IVisUV)
3399                 SvIsUV_on(dstr);
3400             SvIV_set(dstr, SvIVX(sstr));
3401         }
3402         if (SvVOK(sstr)) {
3403             MAGIC *smg = mg_find(sstr,PERL_MAGIC_vstring);
3404             sv_magic(dstr, NULL, PERL_MAGIC_vstring,
3405                         smg->mg_ptr, smg->mg_len);
3406             SvRMAGICAL_on(dstr);
3407         }
3408     }
3409     else if (sflags & SVp_IOK) {
3410         if (sflags & SVf_IOK)
3411             (void)SvIOK_only(dstr);
3412         else {
3413             (void)SvOK_off(dstr);
3414             (void)SvIOKp_on(dstr);
3415         }
3416         /* XXXX Do we want to set IsUV for IV(ROK)?  Be extra safe... */
3417         if (sflags & SVf_IVisUV)
3418             SvIsUV_on(dstr);
3419         SvIV_set(dstr, SvIVX(sstr));
3420         if (sflags & SVp_NOK) {
3421             if (sflags & SVf_NOK)
3422                 (void)SvNOK_on(dstr);
3423             else
3424                 (void)SvNOKp_on(dstr);
3425             SvNV_set(dstr, SvNVX(sstr));
3426         }
3427     }
3428     else if (sflags & SVp_NOK) {
3429         if (sflags & SVf_NOK)
3430             (void)SvNOK_only(dstr);
3431         else {
3432             (void)SvOK_off(dstr);
3433             SvNOKp_on(dstr);
3434         }
3435         SvNV_set(dstr, SvNVX(sstr));
3436     }
3437     else {
3438         if (dtype == SVt_PVGV) {
3439             if (ckWARN(WARN_MISC))
3440                 Perl_warner(aTHX_ packWARN(WARN_MISC), "Undefined value assigned to typeglob");
3441         }
3442         else
3443             (void)SvOK_off(dstr);
3444     }
3445     if (SvTAINTED(sstr))
3446         SvTAINT(dstr);
3447 }
3448
3449 /*
3450 =for apidoc sv_setsv_mg
3451
3452 Like C<sv_setsv>, but also handles 'set' magic.
3453
3454 =cut
3455 */
3456
3457 void
3458 Perl_sv_setsv_mg(pTHX_ SV *dstr, register SV *sstr)
3459 {
3460     sv_setsv(dstr,sstr);
3461     SvSETMAGIC(dstr);
3462 }
3463
3464 #ifdef PERL_OLD_COPY_ON_WRITE
3465 SV *
3466 Perl_sv_setsv_cow(pTHX_ SV *dstr, SV *sstr)
3467 {
3468     STRLEN cur = SvCUR(sstr);
3469     STRLEN len = SvLEN(sstr);
3470     register char *new_pv;
3471
3472     if (DEBUG_C_TEST) {
3473         PerlIO_printf(Perl_debug_log, "Fast copy on write: %p -> %p\n",
3474                       sstr, dstr);
3475         sv_dump(sstr);
3476         if (dstr)
3477                     sv_dump(dstr);
3478     }
3479
3480     if (dstr) {
3481         if (SvTHINKFIRST(dstr))
3482             sv_force_normal_flags(dstr, SV_COW_DROP_PV);
3483         else if (SvPVX_const(dstr))
3484             Safefree(SvPVX_const(dstr));
3485     }
3486     else
3487         new_SV(dstr);
3488     SvUPGRADE(dstr, SVt_PVIV);
3489
3490     assert (SvPOK(sstr));
3491     assert (SvPOKp(sstr));
3492     assert (!SvIOK(sstr));
3493     assert (!SvIOKp(sstr));
3494     assert (!SvNOK(sstr));
3495     assert (!SvNOKp(sstr));
3496
3497     if (SvIsCOW(sstr)) {
3498
3499         if (SvLEN(sstr) == 0) {
3500             /* source is a COW shared hash key.  */
3501             DEBUG_C(PerlIO_printf(Perl_debug_log,
3502                                   "Fast copy on write: Sharing hash\n"));
3503             new_pv = HEK_KEY(share_hek_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr))));
3504             goto common_exit;
3505         }
3506         SV_COW_NEXT_SV_SET(dstr, SV_COW_NEXT_SV(sstr));
3507     } else {
3508         assert ((SvFLAGS(sstr) & CAN_COW_MASK) == CAN_COW_FLAGS);
3509         SvUPGRADE(sstr, SVt_PVIV);
3510         SvREADONLY_on(sstr);
3511         SvFAKE_on(sstr);
3512         DEBUG_C(PerlIO_printf(Perl_debug_log,
3513                               "Fast copy on write: Converting sstr to COW\n"));
3514         SV_COW_NEXT_SV_SET(dstr, sstr);
3515     }
3516     SV_COW_NEXT_SV_SET(sstr, dstr);
3517     new_pv = SvPVX_mutable(sstr);
3518
3519   common_exit:
3520     SvPV_set(dstr, new_pv);
3521     SvFLAGS(dstr) = (SVt_PVIV|SVf_POK|SVp_POK|SVf_FAKE|SVf_READONLY);
3522     if (SvUTF8(sstr))
3523         SvUTF8_on(dstr);
3524     SvLEN_set(dstr, len);
3525     SvCUR_set(dstr, cur);
3526     if (DEBUG_C_TEST) {
3527         sv_dump(dstr);
3528     }
3529     return dstr;
3530 }
3531 #endif
3532
3533 /*
3534 =for apidoc sv_setpvn
3535
3536 Copies a string into an SV.  The C<len> parameter indicates the number of
3537 bytes to be copied.  If the C<ptr> argument is NULL the SV will become
3538 undefined.  Does not handle 'set' magic.  See C<sv_setpvn_mg>.
3539
3540 =cut
3541 */
3542
3543 void
3544 Perl_sv_setpvn(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3545 {
3546     register char *dptr;
3547
3548     SV_CHECK_THINKFIRST_COW_DROP(sv);
3549     if (!ptr) {
3550         (void)SvOK_off(sv);
3551         return;
3552     }
3553     else {
3554         /* len is STRLEN which is unsigned, need to copy to signed */
3555         const IV iv = len;
3556         if (iv < 0)
3557             Perl_croak(aTHX_ "panic: sv_setpvn called with negative strlen");
3558     }
3559     SvUPGRADE(sv, SVt_PV);
3560
3561     dptr = SvGROW(sv, len + 1);
3562     Move(ptr,dptr,len,char);
3563     dptr[len] = '\0';
3564     SvCUR_set(sv, len);
3565     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3566     SvTAINT(sv);
3567 }
3568
3569 /*
3570 =for apidoc sv_setpvn_mg
3571
3572 Like C<sv_setpvn>, but also handles 'set' magic.
3573
3574 =cut
3575 */
3576
3577 void
3578 Perl_sv_setpvn_mg(pTHX_ register SV *sv, register const char *ptr, register STRLEN len)
3579 {
3580     sv_setpvn(sv,ptr,len);
3581     SvSETMAGIC(sv);
3582 }
3583
3584 /*
3585 =for apidoc sv_setpv
3586
3587 Copies a string into an SV.  The string must be null-terminated.  Does not
3588 handle 'set' magic.  See C<sv_setpv_mg>.
3589
3590 =cut
3591 */
3592
3593 void
3594 Perl_sv_setpv(pTHX_ register SV *sv, register const char *ptr)
3595 {
3596     register STRLEN len;
3597
3598     SV_CHECK_THINKFIRST_COW_DROP(sv);
3599     if (!ptr) {
3600         (void)SvOK_off(sv);
3601         return;
3602     }
3603     len = strlen(ptr);
3604     SvUPGRADE(sv, SVt_PV);
3605
3606     SvGROW(sv, len + 1);
3607     Move(ptr,SvPVX(sv),len+1,char);
3608     SvCUR_set(sv, len);
3609     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3610     SvTAINT(sv);
3611 }
3612
3613 /*
3614 =for apidoc sv_setpv_mg
3615
3616 Like C<sv_setpv>, but also handles 'set' magic.
3617
3618 =cut
3619 */
3620
3621 void
3622 Perl_sv_setpv_mg(pTHX_ register SV *sv, register const char *ptr)
3623 {
3624     sv_setpv(sv,ptr);
3625     SvSETMAGIC(sv);
3626 }
3627
3628 /*
3629 =for apidoc sv_usepvn
3630
3631 Tells an SV to use C<ptr> to find its string value.  Normally the string is
3632 stored inside the SV but sv_usepvn allows the SV to use an outside string.
3633 The C<ptr> should point to memory that was allocated by C<malloc>.  The
3634 string length, C<len>, must be supplied.  This function will realloc the
3635 memory pointed to by C<ptr>, so that pointer should not be freed or used by
3636 the programmer after giving it to sv_usepvn.  Does not handle 'set' magic.
3637 See C<sv_usepvn_mg>.
3638
3639 =cut
3640 */
3641
3642 void
3643 Perl_sv_usepvn(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3644 {
3645     STRLEN allocate;
3646     SV_CHECK_THINKFIRST_COW_DROP(sv);
3647     SvUPGRADE(sv, SVt_PV);
3648     if (!ptr) {
3649         (void)SvOK_off(sv);
3650         return;
3651     }
3652     if (SvPVX_const(sv))
3653         SvPV_free(sv);
3654
3655     allocate = PERL_STRLEN_ROUNDUP(len + 1);
3656     ptr = saferealloc (ptr, allocate);
3657     SvPV_set(sv, ptr);
3658     SvCUR_set(sv, len);
3659     SvLEN_set(sv, allocate);
3660     *SvEND(sv) = '\0';
3661     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3662     SvTAINT(sv);
3663 }
3664
3665 /*
3666 =for apidoc sv_usepvn_mg
3667
3668 Like C<sv_usepvn>, but also handles 'set' magic.
3669
3670 =cut
3671 */
3672
3673 void
3674 Perl_sv_usepvn_mg(pTHX_ register SV *sv, register char *ptr, register STRLEN len)
3675 {
3676     sv_usepvn(sv,ptr,len);
3677     SvSETMAGIC(sv);
3678 }
3679
3680 #ifdef PERL_OLD_COPY_ON_WRITE
3681 /* Need to do this *after* making the SV normal, as we need the buffer
3682    pointer to remain valid until after we've copied it.  If we let go too early,
3683    another thread could invalidate it by unsharing last of the same hash key
3684    (which it can do by means other than releasing copy-on-write Svs)
3685    or by changing the other copy-on-write SVs in the loop.  */
3686 STATIC void
3687 S_sv_release_COW(pTHX_ register SV *sv, const char *pvx, STRLEN len, SV *after)
3688 {
3689     if (len) { /* this SV was SvIsCOW_normal(sv) */
3690          /* we need to find the SV pointing to us.  */
3691         SV * const current = SV_COW_NEXT_SV(after);
3692
3693         if (current == sv) {
3694             /* The SV we point to points back to us (there were only two of us
3695                in the loop.)
3696                Hence other SV is no longer copy on write either.  */
3697             SvFAKE_off(after);
3698             SvREADONLY_off(after);
3699         } else {
3700             /* We need to follow the pointers around the loop.  */
3701             SV *next;
3702             while ((next = SV_COW_NEXT_SV(current)) != sv) {
3703                 assert (next);
3704                 current = next;
3705                  /* don't loop forever if the structure is bust, and we have
3706                     a pointer into a closed loop.  */
3707                 assert (current != after);
3708                 assert (SvPVX_const(current) == pvx);
3709             }
3710             /* Make the SV before us point to the SV after us.  */
3711             SV_COW_NEXT_SV_SET(current, after);
3712         }
3713     } else {
3714         unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3715     }
3716 }
3717
3718 int
3719 Perl_sv_release_IVX(pTHX_ register SV *sv)
3720 {
3721     if (SvIsCOW(sv))
3722         sv_force_normal_flags(sv, 0);
3723     SvOOK_off(sv);
3724     return 0;
3725 }
3726 #endif
3727 /*
3728 =for apidoc sv_force_normal_flags
3729
3730 Undo various types of fakery on an SV: if the PV is a shared string, make
3731 a private copy; if we're a ref, stop refing; if we're a glob, downgrade to
3732 an xpvmg; if we're a copy-on-write scalar, this is the on-write time when
3733 we do the copy, and is also used locally. If C<SV_COW_DROP_PV> is set
3734 then a copy-on-write scalar drops its PV buffer (if any) and becomes
3735 SvPOK_off rather than making a copy. (Used where this scalar is about to be
3736 set to some other value.) In addition, the C<flags> parameter gets passed to
3737 C<sv_unref_flags()> when unrefing. C<sv_force_normal> calls this function
3738 with flags set to 0.
3739
3740 =cut
3741 */
3742
3743 void
3744 Perl_sv_force_normal_flags(pTHX_ register SV *sv, U32 flags)
3745 {
3746 #ifdef PERL_OLD_COPY_ON_WRITE
3747     if (SvREADONLY(sv)) {
3748         /* At this point I believe I should acquire a global SV mutex.  */
3749         if (SvFAKE(sv)) {
3750             const char * const pvx = SvPVX_const(sv);
3751             const STRLEN len = SvLEN(sv);
3752             const STRLEN cur = SvCUR(sv);
3753             SV * const next = SV_COW_NEXT_SV(sv);   /* next COW sv in the loop. */
3754             if (DEBUG_C_TEST) {
3755                 PerlIO_printf(Perl_debug_log,
3756                               "Copy on write: Force normal %ld\n",
3757                               (long) flags);
3758                 sv_dump(sv);
3759             }
3760             SvFAKE_off(sv);
3761             SvREADONLY_off(sv);
3762             /* This SV doesn't own the buffer, so need to Newx() a new one:  */
3763             SvPV_set(sv, (char*)0);
3764             SvLEN_set(sv, 0);
3765             if (flags & SV_COW_DROP_PV) {
3766                 /* OK, so we don't need to copy our buffer.  */
3767                 SvPOK_off(sv);
3768             } else {
3769                 SvGROW(sv, cur + 1);
3770                 Move(pvx,SvPVX(sv),cur,char);
3771                 SvCUR_set(sv, cur);
3772                 *SvEND(sv) = '\0';
3773             }
3774             sv_release_COW(sv, pvx, len, next);
3775             if (DEBUG_C_TEST) {
3776                 sv_dump(sv);
3777             }
3778         }
3779         else if (IN_PERL_RUNTIME)
3780             Perl_croak(aTHX_ PL_no_modify);
3781         /* At this point I believe that I can drop the global SV mutex.  */
3782     }
3783 #else
3784     if (SvREADONLY(sv)) {
3785         if (SvFAKE(sv)) {
3786             const char * const pvx = SvPVX_const(sv);
3787             const STRLEN len = SvCUR(sv);
3788             SvFAKE_off(sv);
3789             SvREADONLY_off(sv);
3790             SvPV_set(sv, Nullch);
3791             SvLEN_set(sv, 0);
3792             SvGROW(sv, len + 1);
3793             Move(pvx,SvPVX(sv),len,char);
3794             *SvEND(sv) = '\0';
3795             unshare_hek(SvSHARED_HEK_FROM_PV(pvx));
3796         }
3797         else if (IN_PERL_RUNTIME)
3798             Perl_croak(aTHX_ PL_no_modify);
3799     }
3800 #endif
3801     if (SvROK(sv))
3802         sv_unref_flags(sv, flags);
3803     else if (SvFAKE(sv) && SvTYPE(sv) == SVt_PVGV)
3804         sv_unglob(sv);
3805 }
3806
3807 /*
3808 =for apidoc sv_chop
3809
3810 Efficient removal of characters from the beginning of the string buffer.
3811 SvPOK(sv) must be true and the C<ptr> must be a pointer to somewhere inside
3812 the string buffer.  The C<ptr> becomes the first character of the adjusted
3813 string. Uses the "OOK hack".
3814 Beware: after this function returns, C<ptr> and SvPVX_const(sv) may no longer
3815 refer to the same chunk of data.
3816
3817 =cut
3818 */
3819
3820 void
3821 Perl_sv_chop(pTHX_ register SV *sv, register const char *ptr)
3822 {
3823     register STRLEN delta;
3824     if (!ptr || !SvPOKp(sv))
3825         return;
3826     delta = ptr - SvPVX_const(sv);
3827     SV_CHECK_THINKFIRST(sv);
3828     if (SvTYPE(sv) < SVt_PVIV)
3829         sv_upgrade(sv,SVt_PVIV);
3830
3831     if (!SvOOK(sv)) {
3832         if (!SvLEN(sv)) { /* make copy of shared string */
3833             const char *pvx = SvPVX_const(sv);
3834             const STRLEN len = SvCUR(sv);
3835             SvGROW(sv, len + 1);
3836             Move(pvx,SvPVX(sv),len,char);
3837             *SvEND(sv) = '\0';
3838         }
3839         SvIV_set(sv, 0);
3840         /* Same SvOOK_on but SvOOK_on does a SvIOK_off
3841            and we do that anyway inside the SvNIOK_off
3842         */
3843         SvFLAGS(sv) |= SVf_OOK;
3844     }
3845     SvNIOK_off(sv);
3846     SvLEN_set(sv, SvLEN(sv) - delta);
3847     SvCUR_set(sv, SvCUR(sv) - delta);
3848     SvPV_set(sv, SvPVX(sv) + delta);
3849     SvIV_set(sv, SvIVX(sv) + delta);
3850 }
3851
3852 /*
3853 =for apidoc sv_catpvn
3854
3855 Concatenates the string onto the end of the string which is in the SV.  The
3856 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3857 status set, then the bytes appended should be valid UTF-8.
3858 Handles 'get' magic, but not 'set' magic.  See C<sv_catpvn_mg>.
3859
3860 =for apidoc sv_catpvn_flags
3861
3862 Concatenates the string onto the end of the string which is in the SV.  The
3863 C<len> indicates number of bytes to copy.  If the SV has the UTF-8
3864 status set, then the bytes appended should be valid UTF-8.
3865 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<dsv> if
3866 appropriate, else not. C<sv_catpvn> and C<sv_catpvn_nomg> are implemented
3867 in terms of this function.
3868
3869 =cut
3870 */
3871
3872 void
3873 Perl_sv_catpvn_flags(pTHX_ register SV *dsv, register const char *sstr, register STRLEN slen, I32 flags)
3874 {
3875     STRLEN dlen;
3876     const char *dstr = SvPV_force_flags(dsv, dlen, flags);
3877
3878     SvGROW(dsv, dlen + slen + 1);
3879     if (sstr == dstr)
3880         sstr = SvPVX_const(dsv);
3881     Move(sstr, SvPVX(dsv) + dlen, slen, char);
3882     SvCUR_set(dsv, SvCUR(dsv) + slen);
3883     *SvEND(dsv) = '\0';
3884     (void)SvPOK_only_UTF8(dsv);         /* validate pointer */
3885     SvTAINT(dsv);
3886     if (flags & SV_SMAGIC)
3887         SvSETMAGIC(dsv);
3888 }
3889
3890 /*
3891 =for apidoc sv_catsv
3892
3893 Concatenates the string from SV C<ssv> onto the end of the string in
3894 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  Handles 'get' magic, but
3895 not 'set' magic.  See C<sv_catsv_mg>.
3896
3897 =for apidoc sv_catsv_flags
3898
3899 Concatenates the string from SV C<ssv> onto the end of the string in
3900 SV C<dsv>.  Modifies C<dsv> but not C<ssv>.  If C<flags> has C<SV_GMAGIC>
3901 bit set, will C<mg_get> on the SVs if appropriate, else not. C<sv_catsv>
3902 and C<sv_catsv_nomg> are implemented in terms of this function.
3903
3904 =cut */
3905
3906 void
3907 Perl_sv_catsv_flags(pTHX_ SV *dsv, register SV *ssv, I32 flags)
3908 {
3909     const char *spv;
3910     STRLEN slen;
3911     if (ssv) {
3912         if ((spv = SvPV_const(ssv, slen))) {
3913             /*  sutf8 and dutf8 were type bool, but under USE_ITHREADS,
3914                 gcc version 2.95.2 20000220 (Debian GNU/Linux) for
3915                 Linux xxx 2.2.17 on sparc64 with gcc -O2, we erroneously
3916                 get dutf8 = 0x20000000, (i.e.  SVf_UTF8) even though
3917                 dsv->sv_flags doesn't have that bit set.
3918                 Andy Dougherty  12 Oct 2001
3919             */
3920             const I32 sutf8 = DO_UTF8(ssv);
3921             I32 dutf8;
3922
3923             if (SvGMAGICAL(dsv) && (flags & SV_GMAGIC))
3924                 mg_get(dsv);
3925             dutf8 = DO_UTF8(dsv);
3926
3927             if (dutf8 != sutf8) {
3928                 if (dutf8) {
3929                     /* Not modifying source SV, so taking a temporary copy. */
3930                     SV* csv = sv_2mortal(newSVpvn(spv, slen));
3931
3932                     sv_utf8_upgrade(csv);
3933                     spv = SvPV_const(csv, slen);
3934                 }
3935                 else
3936                     sv_utf8_upgrade_nomg(dsv);
3937             }
3938             sv_catpvn_nomg(dsv, spv, slen);
3939         }
3940     }
3941     if (flags & SV_SMAGIC)
3942         SvSETMAGIC(dsv);
3943 }
3944
3945 /*
3946 =for apidoc sv_catpv
3947
3948 Concatenates the string onto the end of the string which is in the SV.
3949 If the SV has the UTF-8 status set, then the bytes appended should be
3950 valid UTF-8.  Handles 'get' magic, but not 'set' magic.  See C<sv_catpv_mg>.
3951
3952 =cut */
3953
3954 void
3955 Perl_sv_catpv(pTHX_ register SV *sv, register const char *ptr)
3956 {
3957     register STRLEN len;
3958     STRLEN tlen;
3959     char *junk;
3960
3961     if (!ptr)
3962         return;
3963     junk = SvPV_force(sv, tlen);
3964     len = strlen(ptr);
3965     SvGROW(sv, tlen + len + 1);
3966     if (ptr == junk)
3967         ptr = SvPVX_const(sv);
3968     Move(ptr,SvPVX(sv)+tlen,len+1,char);
3969     SvCUR_set(sv, SvCUR(sv) + len);
3970     (void)SvPOK_only_UTF8(sv);          /* validate pointer */
3971     SvTAINT(sv);
3972 }
3973
3974 /*
3975 =for apidoc sv_catpv_mg
3976
3977 Like C<sv_catpv>, but also handles 'set' magic.
3978
3979 =cut
3980 */
3981
3982 void
3983 Perl_sv_catpv_mg(pTHX_ register SV *sv, register const char *ptr)
3984 {
3985     sv_catpv(sv,ptr);
3986     SvSETMAGIC(sv);
3987 }
3988
3989 /*
3990 =for apidoc newSV
3991
3992 Create a new null SV, or if len > 0, create a new empty SVt_PV type SV
3993 with an initial PV allocation of len+1. Normally accessed via the C<NEWSV>
3994 macro.
3995
3996 =cut
3997 */
3998
3999 SV *
4000 Perl_newSV(pTHX_ STRLEN len)
4001 {
4002     register SV *sv;
4003
4004     new_SV(sv);
4005     if (len) {
4006         sv_upgrade(sv, SVt_PV);
4007         SvGROW(sv, len + 1);
4008     }
4009     return sv;
4010 }
4011 /*
4012 =for apidoc sv_magicext
4013
4014 Adds magic to an SV, upgrading it if necessary. Applies the
4015 supplied vtable and returns a pointer to the magic added.
4016
4017 Note that C<sv_magicext> will allow things that C<sv_magic> will not.
4018 In particular, you can add magic to SvREADONLY SVs, and add more than
4019 one instance of the same 'how'.
4020
4021 If C<namlen> is greater than zero then a C<savepvn> I<copy> of C<name> is
4022 stored, if C<namlen> is zero then C<name> is stored as-is and - as another
4023 special case - if C<(name && namlen == HEf_SVKEY)> then C<name> is assumed
4024 to contain an C<SV*> and is stored as-is with its REFCNT incremented.
4025
4026 (This is now used as a subroutine by C<sv_magic>.)
4027
4028 =cut
4029 */
4030 MAGIC * 
4031 Perl_sv_magicext(pTHX_ SV* sv, SV* obj, int how, const MGVTBL *vtable,
4032                  const char* name, I32 namlen)
4033 {
4034     MAGIC* mg;
4035
4036     if (SvTYPE(sv) < SVt_PVMG) {
4037         SvUPGRADE(sv, SVt_PVMG);
4038     }
4039     Newxz(mg, 1, MAGIC);
4040     mg->mg_moremagic = SvMAGIC(sv);
4041     SvMAGIC_set(sv, mg);
4042
4043     /* Sometimes a magic contains a reference loop, where the sv and
4044        object refer to each other.  To prevent a reference loop that
4045        would prevent such objects being freed, we look for such loops
4046        and if we find one we avoid incrementing the object refcount.
4047
4048        Note we cannot do this to avoid self-tie loops as intervening RV must
4049        have its REFCNT incremented to keep it in existence.
4050
4051     */
4052     if (!obj || obj == sv ||
4053         how == PERL_MAGIC_arylen ||
4054         how == PERL_MAGIC_qr ||
4055         how == PERL_MAGIC_symtab ||
4056         (SvTYPE(obj) == SVt_PVGV &&
4057             (GvSV(obj) == sv || GvHV(obj) == (HV*)sv || GvAV(obj) == (AV*)sv ||
4058             GvCV(obj) == (CV*)sv || GvIOp(obj) == (IO*)sv ||
4059             GvFORM(obj) == (CV*)sv)))
4060     {
4061         mg->mg_obj = obj;
4062     }
4063     else {
4064         mg->mg_obj = SvREFCNT_inc(obj);
4065         mg->mg_flags |= MGf_REFCOUNTED;
4066     }
4067
4068     /* Normal self-ties simply pass a null object, and instead of
4069        using mg_obj directly, use the SvTIED_obj macro to produce a
4070        new RV as needed.  For glob "self-ties", we are tieing the PVIO
4071        with an RV obj pointing to the glob containing the PVIO.  In
4072        this case, to avoid a reference loop, we need to weaken the
4073        reference.
4074     */
4075
4076     if (how == PERL_MAGIC_tiedscalar && SvTYPE(sv) == SVt_PVIO &&
4077         obj && SvROK(obj) && GvIO(SvRV(obj)) == (IO*)sv)
4078     {
4079       sv_rvweaken(obj);
4080     }
4081
4082     mg->mg_type = how;
4083     mg->mg_len = namlen;
4084     if (name) {
4085         if (namlen > 0)
4086             mg->mg_ptr = savepvn(name, namlen);
4087         else if (namlen == HEf_SVKEY)
4088             mg->mg_ptr = (char*)SvREFCNT_inc((SV*)name);
4089         else
4090             mg->mg_ptr = (char *) name;
4091     }
4092     mg->mg_virtual = vtable;
4093
4094     mg_magical(sv);
4095     if (SvGMAGICAL(sv))
4096         SvFLAGS(sv) &= ~(SVf_IOK|SVf_NOK|SVf_POK);
4097     return mg;
4098 }
4099
4100 /*
4101 =for apidoc sv_magic
4102
4103 Adds magic to an SV. First upgrades C<sv> to type C<SVt_PVMG> if necessary,
4104 then adds a new magic item of type C<how> to the head of the magic list.
4105
4106 See C<sv_magicext> (which C<sv_magic> now calls) for a description of the
4107 handling of the C<name> and C<namlen> arguments.
4108
4109 You need to use C<sv_magicext> to add magic to SvREADONLY SVs and also
4110 to add more than one instance of the same 'how'.
4111
4112 =cut
4113 */
4114
4115 void
4116 Perl_sv_magic(pTHX_ register SV *sv, SV *obj, int how, const char *name, I32 namlen)
4117 {
4118     const MGVTBL *vtable;
4119     MAGIC* mg;
4120
4121 #ifdef PERL_OLD_COPY_ON_WRITE
4122     if (SvIsCOW(sv))
4123         sv_force_normal_flags(sv, 0);
4124 #endif
4125     if (SvREADONLY(sv)) {
4126         if (
4127             /* its okay to attach magic to shared strings; the subsequent
4128              * upgrade to PVMG will unshare the string */
4129             !(SvFAKE(sv) && SvTYPE(sv) < SVt_PVMG)
4130
4131             && IN_PERL_RUNTIME
4132             && how != PERL_MAGIC_regex_global
4133             && how != PERL_MAGIC_bm
4134             && how != PERL_MAGIC_fm
4135             && how != PERL_MAGIC_sv
4136             && how != PERL_MAGIC_backref
4137            )
4138         {
4139             Perl_croak(aTHX_ PL_no_modify);
4140         }
4141     }
4142     if (SvMAGICAL(sv) || (how == PERL_MAGIC_taint && SvTYPE(sv) >= SVt_PVMG)) {
4143         if (SvMAGIC(sv) && (mg = mg_find(sv, how))) {
4144             /* sv_magic() refuses to add a magic of the same 'how' as an
4145                existing one
4146              */
4147             if (how == PERL_MAGIC_taint)
4148                 mg->mg_len |= 1;
4149             return;
4150         }
4151     }
4152
4153     switch (how) {
4154     case PERL_MAGIC_sv:
4155         vtable = &PL_vtbl_sv;
4156         break;
4157     case PERL_MAGIC_overload:
4158         vtable = &PL_vtbl_amagic;
4159         break;
4160     case PERL_MAGIC_overload_elem:
4161         vtable = &PL_vtbl_amagicelem;
4162         break;
4163     case PERL_MAGIC_overload_table:
4164         vtable = &PL_vtbl_ovrld;
4165         break;
4166     case PERL_MAGIC_bm:
4167         vtable = &PL_vtbl_bm;
4168         break;
4169     case PERL_MAGIC_regdata:
4170         vtable = &PL_vtbl_regdata;
4171         break;
4172     case PERL_MAGIC_regdatum:
4173         vtable = &PL_vtbl_regdatum;
4174         break;
4175     case PERL_MAGIC_env:
4176         vtable = &PL_vtbl_env;
4177         break;
4178     case PERL_MAGIC_fm:
4179         vtable = &PL_vtbl_fm;
4180         break;
4181     case PERL_MAGIC_envelem:
4182         vtable = &PL_vtbl_envelem;
4183         break;
4184     case PERL_MAGIC_regex_global:
4185         vtable = &PL_vtbl_mglob;
4186         break;
4187     case PERL_MAGIC_isa:
4188         vtable = &PL_vtbl_isa;
4189         break;
4190     case PERL_MAGIC_isaelem:
4191         vtable = &PL_vtbl_isaelem;
4192         break;
4193     case PERL_MAGIC_nkeys:
4194         vtable = &PL_vtbl_nkeys;
4195         break;
4196     case PERL_MAGIC_dbfile:
4197         vtable = NULL;
4198         break;
4199     case PERL_MAGIC_dbline:
4200         vtable = &PL_vtbl_dbline;
4201         break;
4202 #ifdef USE_LOCALE_COLLATE
4203     case PERL_MAGIC_collxfrm:
4204         vtable = &PL_vtbl_collxfrm;
4205         break;
4206 #endif /* USE_LOCALE_COLLATE */
4207     case PERL_MAGIC_tied:
4208         vtable = &PL_vtbl_pack;
4209         break;
4210     case PERL_MAGIC_tiedelem:
4211     case PERL_MAGIC_tiedscalar:
4212         vtable = &PL_vtbl_packelem;
4213         break;
4214     case PERL_MAGIC_qr:
4215         vtable = &PL_vtbl_regexp;
4216         break;
4217     case PERL_MAGIC_sig:
4218         vtable = &PL_vtbl_sig;
4219         break;
4220     case PERL_MAGIC_sigelem:
4221         vtable = &PL_vtbl_sigelem;
4222         break;
4223     case PERL_MAGIC_taint:
4224         vtable = &PL_vtbl_taint;
4225         break;
4226     case PERL_MAGIC_uvar:
4227         vtable = &PL_vtbl_uvar;
4228         break;
4229     case PERL_MAGIC_vec:
4230         vtable = &PL_vtbl_vec;
4231         break;
4232     case PERL_MAGIC_arylen_p:
4233     case PERL_MAGIC_rhash:
4234     case PERL_MAGIC_symtab:
4235     case PERL_MAGIC_vstring:
4236         vtable = NULL;
4237         break;
4238     case PERL_MAGIC_utf8:
4239         vtable = &PL_vtbl_utf8;
4240         break;
4241     case PERL_MAGIC_substr:
4242         vtable = &PL_vtbl_substr;
4243         break;
4244     case PERL_MAGIC_defelem:
4245         vtable = &PL_vtbl_defelem;
4246         break;
4247     case PERL_MAGIC_glob:
4248         vtable = &PL_vtbl_glob;
4249         break;
4250     case PERL_MAGIC_arylen:
4251         vtable = &PL_vtbl_arylen;
4252         break;
4253     case PERL_MAGIC_pos:
4254         vtable = &PL_vtbl_pos;
4255         break;
4256     case PERL_MAGIC_backref:
4257         vtable = &PL_vtbl_backref;
4258         break;
4259     case PERL_MAGIC_ext:
4260         /* Reserved for use by extensions not perl internals.           */
4261         /* Useful for attaching extension internal data to perl vars.   */
4262         /* Note that multiple extensions may clash if magical scalars   */
4263         /* etc holding private data from one are passed to another.     */
4264         vtable = NULL;
4265         break;
4266     default:
4267         Perl_croak(aTHX_ "Don't know how to handle magic of type \\%o", how);
4268     }
4269
4270     /* Rest of work is done else where */
4271     mg = sv_magicext(sv,obj,how,vtable,name,namlen);
4272
4273     switch (how) {
4274     case PERL_MAGIC_taint:
4275         mg->mg_len = 1;
4276         break;
4277     case PERL_MAGIC_ext:
4278     case PERL_MAGIC_dbfile:
4279         SvRMAGICAL_on(sv);
4280         break;
4281     }
4282 }
4283
4284 /*
4285 =for apidoc sv_unmagic
4286
4287 Removes all magic of type C<type> from an SV.
4288
4289 =cut
4290 */
4291
4292 int
4293 Perl_sv_unmagic(pTHX_ SV *sv, int type)
4294 {
4295     MAGIC* mg;
4296     MAGIC** mgp;
4297     if (SvTYPE(sv) < SVt_PVMG || !SvMAGIC(sv))
4298         return 0;
4299     mgp = &SvMAGIC(sv);
4300     for (mg = *mgp; mg; mg = *mgp) {
4301         if (mg->mg_type == type) {
4302             const MGVTBL* const vtbl = mg->mg_virtual;
4303             *mgp = mg->mg_moremagic;
4304             if (vtbl && vtbl->svt_free)
4305                 CALL_FPTR(vtbl->svt_free)(aTHX_ sv, mg);
4306             if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
4307                 if (mg->mg_len > 0)
4308                     Safefree(mg->mg_ptr);
4309                 else if (mg->mg_len == HEf_SVKEY)
4310                     SvREFCNT_dec((SV*)mg->mg_ptr);
4311                 else if (mg->mg_type == PERL_MAGIC_utf8 && mg->mg_ptr)
4312                     Safefree(mg->mg_ptr);
4313             }
4314             if (mg->mg_flags & MGf_REFCOUNTED)
4315                 SvREFCNT_dec(mg->mg_obj);
4316             Safefree(mg);
4317         }
4318         else
4319             mgp = &mg->mg_moremagic;
4320     }
4321     if (!SvMAGIC(sv)) {
4322         SvMAGICAL_off(sv);
4323        SvFLAGS(sv) |= (SvFLAGS(sv) & (SVp_NOK|SVp_POK)) >> PRIVSHIFT;
4324     }
4325
4326     return 0;
4327 }
4328
4329 /*
4330 =for apidoc sv_rvweaken
4331
4332 Weaken a reference: set the C<SvWEAKREF> flag on this RV; give the
4333 referred-to SV C<PERL_MAGIC_backref> magic if it hasn't already; and
4334 push a back-reference to this RV onto the array of backreferences
4335 associated with that magic.
4336
4337 =cut
4338 */
4339
4340 SV *
4341 Perl_sv_rvweaken(pTHX_ SV *sv)
4342 {
4343     SV *tsv;
4344     if (!SvOK(sv))  /* let undefs pass */
4345         return sv;
4346     if (!SvROK(sv))
4347         Perl_croak(aTHX_ "Can't weaken a nonreference");
4348     else if (SvWEAKREF(sv)) {
4349         if (ckWARN(WARN_MISC))
4350             Perl_warner(aTHX_ packWARN(WARN_MISC), "Reference is already weak");
4351         return sv;
4352     }
4353     tsv = SvRV(sv);
4354     Perl_sv_add_backref(aTHX_ tsv, sv);
4355     SvWEAKREF_on(sv);
4356     SvREFCNT_dec(tsv);
4357     return sv;
4358 }
4359
4360 /* Give tsv backref magic if it hasn't already got it, then push a
4361  * back-reference to sv onto the array associated with the backref magic.
4362  */
4363
4364 void
4365 Perl_sv_add_backref(pTHX_ SV *tsv, SV *sv)
4366 {
4367     AV *av;
4368     MAGIC *mg;
4369     if (SvMAGICAL(tsv) && (mg = mg_find(tsv, PERL_MAGIC_backref)))
4370         av = (AV*)mg->mg_obj;
4371     else {
4372         av = newAV();
4373         sv_magic(tsv, (SV*)av, PERL_MAGIC_backref, NULL, 0);
4374         /* av now has a refcnt of 2, which avoids it getting freed
4375          * before us during global cleanup. The extra ref is removed
4376          * by magic_killbackrefs() when tsv is being freed */
4377     }
4378     if (AvFILLp(av) >= AvMAX(av)) {
4379         av_extend(av, AvFILLp(av)+1);
4380     }
4381     AvARRAY(av)[++AvFILLp(av)] = sv; /* av_push() */
4382 }
4383
4384 /* delete a back-reference to ourselves from the backref magic associated
4385  * with the SV we point to.
4386  */
4387
4388 STATIC void
4389 S_sv_del_backref(pTHX_ SV *tsv, SV *sv)
4390 {
4391     AV *av;
4392     SV **svp;
4393     I32 i;
4394     MAGIC *mg = NULL;
4395     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref))) {
4396         if (PL_in_clean_all)
4397             return;
4398     }
4399     if (!SvMAGICAL(tsv) || !(mg = mg_find(tsv, PERL_MAGIC_backref)))
4400         Perl_croak(aTHX_ "panic: del_backref");
4401     av = (AV *)mg->mg_obj;
4402     svp = AvARRAY(av);
4403     /* We shouldn't be in here more than once, but for paranoia reasons lets
4404        not assume this.  */
4405     for (i = AvFILLp(av); i >= 0; i--) {
4406         if (svp[i] == sv) {
4407             const SSize_t fill = AvFILLp(av);
4408             if (i != fill) {
4409                 /* We weren't the last entry.
4410                    An unordered list has this property that you can take the
4411                    last element off the end to fill the hole, and it's still
4412                    an unordered list :-)
4413                 */
4414                 svp[i] = svp[fill];
4415             }
4416             svp[fill] = Nullsv;
4417             AvFILLp(av) = fill - 1;
4418         }
4419     }
4420 }
4421
4422 /*
4423 =for apidoc sv_insert
4424
4425 Inserts a string at the specified offset/length within the SV. Similar to
4426 the Perl substr() function.
4427
4428 =cut
4429 */
4430
4431 void
4432 Perl_sv_insert(pTHX_ SV *bigstr, STRLEN offset, STRLEN len, const char *little, STRLEN littlelen)
4433 {
4434     register char *big;
4435     register char *mid;
4436     register char *midend;
4437     register char *bigend;
4438     register I32 i;
4439     STRLEN curlen;
4440
4441
4442     if (!bigstr)
4443         Perl_croak(aTHX_ "Can't modify non-existent substring");
4444     SvPV_force(bigstr, curlen);
4445     (void)SvPOK_only_UTF8(bigstr);
4446     if (offset + len > curlen) {
4447         SvGROW(bigstr, offset+len+1);
4448         Zero(SvPVX(bigstr)+curlen, offset+len-curlen, char);
4449         SvCUR_set(bigstr, offset+len);
4450     }
4451
4452     SvTAINT(bigstr);
4453     i = littlelen - len;
4454     if (i > 0) {                        /* string might grow */
4455         big = SvGROW(bigstr, SvCUR(bigstr) + i + 1);
4456         mid = big + offset + len;
4457         midend = bigend = big + SvCUR(bigstr);
4458         bigend += i;
4459         *bigend = '\0';
4460         while (midend > mid)            /* shove everything down */
4461             *--bigend = *--midend;
4462         Move(little,big+offset,littlelen,char);
4463         SvCUR_set(bigstr, SvCUR(bigstr) + i);
4464         SvSETMAGIC(bigstr);
4465         return;
4466     }
4467     else if (i == 0) {
4468         Move(little,SvPVX(bigstr)+offset,len,char);
4469         SvSETMAGIC(bigstr);
4470         return;
4471     }
4472
4473     big = SvPVX(bigstr);
4474     mid = big + offset;
4475     midend = mid + len;
4476     bigend = big + SvCUR(bigstr);
4477
4478     if (midend > bigend)
4479         Perl_croak(aTHX_ "panic: sv_insert");
4480
4481     if (mid - big > bigend - midend) {  /* faster to shorten from end */
4482         if (littlelen) {
4483             Move(little, mid, littlelen,char);
4484             mid += littlelen;
4485         }
4486         i = bigend - midend;
4487         if (i > 0) {
4488             Move(midend, mid, i,char);
4489             mid += i;
4490         }
4491         *mid = '\0';
4492         SvCUR_set(bigstr, mid - big);
4493     }
4494     else if ((i = mid - big)) { /* faster from front */
4495         midend -= littlelen;
4496         mid = midend;
4497         sv_chop(bigstr,midend-i);
4498         big += i;
4499         while (i--)
4500             *--midend = *--big;
4501         if (littlelen)
4502             Move(little, mid, littlelen,char);
4503     }
4504     else if (littlelen) {
4505         midend -= littlelen;
4506         sv_chop(bigstr,midend);
4507         Move(little,midend,littlelen,char);
4508     }
4509     else {
4510         sv_chop(bigstr,midend);
4511     }
4512     SvSETMAGIC(bigstr);
4513 }
4514
4515 /*
4516 =for apidoc sv_replace
4517
4518 Make the first argument a copy of the second, then delete the original.
4519 The target SV physically takes over ownership of the body of the source SV
4520 and inherits its flags; however, the target keeps any magic it owns,
4521 and any magic in the source is discarded.
4522 Note that this is a rather specialist SV copying operation; most of the
4523 time you'll want to use C<sv_setsv> or one of its many macro front-ends.
4524
4525 =cut
4526 */
4527
4528 void
4529 Perl_sv_replace(pTHX_ register SV *sv, register SV *nsv)
4530 {
4531     const U32 refcnt = SvREFCNT(sv);
4532     SV_CHECK_THINKFIRST_COW_DROP(sv);
4533     if (SvREFCNT(nsv) != 1) {
4534         Perl_croak(aTHX_ "panic: reference miscount on nsv in sv_replace() (%"
4535                    UVuf " != 1)", (UV) SvREFCNT(nsv));
4536     }
4537     if (SvMAGICAL(sv)) {
4538         if (SvMAGICAL(nsv))
4539             mg_free(nsv);
4540         else
4541             sv_upgrade(nsv, SVt_PVMG);
4542         SvMAGIC_set(nsv, SvMAGIC(sv));
4543         SvFLAGS(nsv) |= SvMAGICAL(sv);
4544         SvMAGICAL_off(sv);
4545         SvMAGIC_set(sv, NULL);
4546     }
4547     SvREFCNT(sv) = 0;
4548     sv_clear(sv);
4549     assert(!SvREFCNT(sv));
4550 #ifdef DEBUG_LEAKING_SCALARS
4551     sv->sv_flags  = nsv->sv_flags;
4552     sv->sv_any    = nsv->sv_any;
4553     sv->sv_refcnt = nsv->sv_refcnt;
4554     sv->sv_u      = nsv->sv_u;
4555 #else
4556     StructCopy(nsv,sv,SV);
4557 #endif
4558     /* Currently could join these into one piece of pointer arithmetic, but
4559        it would be unclear.  */
4560     if(SvTYPE(sv) == SVt_IV)
4561         SvANY(sv)
4562             = (XPVIV*)((char*)&(sv->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
4563     else if (SvTYPE(sv) == SVt_RV) {
4564         SvANY(sv) = &sv->sv_u.svu_rv;
4565     }
4566         
4567
4568 #ifdef PERL_OLD_COPY_ON_WRITE
4569     if (SvIsCOW_normal(nsv)) {
4570         /* We need to follow the pointers around the loop to make the
4571            previous SV point to sv, rather than nsv.  */
4572         SV *next;
4573         SV *current = nsv;
4574         while ((next = SV_COW_NEXT_SV(current)) != nsv) {
4575             assert(next);
4576             current = next;
4577             assert(SvPVX_const(current) == SvPVX_const(nsv));
4578         }
4579         /* Make the SV before us point to the SV after us.  */
4580         if (DEBUG_C_TEST) {
4581             PerlIO_printf(Perl_debug_log, "previous is\n");
4582             sv_dump(current);
4583             PerlIO_printf(Perl_debug_log,
4584                           "move it from 0x%"UVxf" to 0x%"UVxf"\n",
4585                           (UV) SV_COW_NEXT_SV(current), (UV) sv);
4586         }
4587         SV_COW_NEXT_SV_SET(current, sv);
4588     }
4589 #endif
4590     SvREFCNT(sv) = refcnt;
4591     SvFLAGS(nsv) |= SVTYPEMASK;         /* Mark as freed */
4592     SvREFCNT(nsv) = 0;
4593     del_SV(nsv);
4594 }
4595
4596 /*
4597 =for apidoc sv_clear
4598
4599 Clear an SV: call any destructors, free up any memory used by the body,
4600 and free the body itself. The SV's head is I<not> freed, although
4601 its type is set to all 1's so that it won't inadvertently be assumed
4602 to be live during global destruction etc.
4603 This function should only be called when REFCNT is zero. Most of the time
4604 you'll want to call C<sv_free()> (or its macro wrapper C<SvREFCNT_dec>)
4605 instead.
4606
4607 =cut
4608 */
4609
4610 void
4611 Perl_sv_clear(pTHX_ register SV *sv)
4612 {
4613     dVAR;
4614     const U32 type = SvTYPE(sv);
4615     const struct body_details *const sv_type_details
4616         = bodies_by_type + type;
4617
4618     assert(sv);
4619     assert(SvREFCNT(sv) == 0);
4620
4621     if (type <= SVt_IV)
4622         return;
4623
4624     if (SvOBJECT(sv)) {
4625         if (PL_defstash) {              /* Still have a symbol table? */
4626             dSP;
4627             HV* stash;
4628             do {        
4629                 CV* destructor;
4630                 stash = SvSTASH(sv);
4631                 destructor = StashHANDLER(stash,DESTROY);
4632                 if (destructor) {
4633                     SV* const tmpref = newRV(sv);
4634                     SvREADONLY_on(tmpref);   /* DESTROY() could be naughty */
4635                     ENTER;
4636                     PUSHSTACKi(PERLSI_DESTROY);
4637                     EXTEND(SP, 2);
4638                     PUSHMARK(SP);
4639                     PUSHs(tmpref);
4640                     PUTBACK;
4641                     call_sv((SV*)destructor, G_DISCARD|G_EVAL|G_KEEPERR|G_VOID);
4642                 
4643                 
4644                     POPSTACK;
4645                     SPAGAIN;
4646                     LEAVE;
4647                     if(SvREFCNT(tmpref) < 2) {
4648                         /* tmpref is not kept alive! */
4649                         SvREFCNT(sv)--;
4650                         SvRV_set(tmpref, NULL);
4651                         SvROK_off(tmpref);
4652                     }
4653                     SvREFCNT_dec(tmpref);
4654                 }
4655             } while (SvOBJECT(sv) && SvSTASH(sv) != stash);
4656
4657
4658             if (SvREFCNT(sv)) {
4659                 if (PL_in_clean_objs)
4660                     Perl_croak(aTHX_ "DESTROY created new reference to dead object '%s'",
4661                           HvNAME_get(stash));
4662                 /* DESTROY gave object new lease on life */
4663                 return;
4664             }
4665         }
4666
4667         if (SvOBJECT(sv)) {
4668             SvREFCNT_dec(SvSTASH(sv));  /* possibly of changed persuasion */
4669             SvOBJECT_off(sv);   /* Curse the object. */
4670             if (type != SVt_PVIO)
4671                 --PL_sv_objcount;       /* XXX Might want something more general */
4672         }
4673     }
4674     if (type >= SVt_PVMG) {
4675         if (SvMAGIC(sv))
4676             mg_free(sv);
4677         if (type == SVt_PVMG && SvFLAGS(sv) & SVpad_TYPED)
4678             SvREFCNT_dec(SvSTASH(sv));
4679     }
4680     switch (type) {
4681     case SVt_PVIO:
4682         if (IoIFP(sv) &&
4683             IoIFP(sv) != PerlIO_stdin() &&
4684             IoIFP(sv) != PerlIO_stdout() &&
4685             IoIFP(sv) != PerlIO_stderr())
4686         {
4687             io_close((IO*)sv, FALSE);
4688         }
4689         if (IoDIRP(sv) && !(IoFLAGS(sv) & IOf_FAKE_DIRP))
4690             PerlDir_close(IoDIRP(sv));
4691         IoDIRP(sv) = (DIR*)NULL;
4692         Safefree(IoTOP_NAME(sv));
4693         Safefree(IoFMT_NAME(sv));
4694         Safefree(IoBOTTOM_NAME(sv));
4695         goto freescalar;
4696     case SVt_PVBM:
4697         goto freescalar;
4698     case SVt_PVCV:
4699     case SVt_PVFM:
4700         cv_undef((CV*)sv);
4701         goto freescalar;
4702     case SVt_PVHV:
4703         hv_undef((HV*)sv);
4704         break;
4705     case SVt_PVAV:
4706         av_undef((AV*)sv);
4707         break;
4708     case SVt_PVLV:
4709         if (LvTYPE(sv) == 'T') { /* for tie: return HE to pool */
4710             SvREFCNT_dec(HeKEY_sv((HE*)LvTARG(sv)));
4711             HeNEXT((HE*)LvTARG(sv)) = PL_hv_fetch_ent_mh;
4712             PL_hv_fetch_ent_mh = (HE*)LvTARG(sv);
4713         }
4714         else if (LvTYPE(sv) != 't') /* unless tie: unrefcnted fake SV**  */
4715             SvREFCNT_dec(LvTARG(sv));
4716         goto freescalar;
4717     case SVt_PVGV:
4718         gp_free((GV*)sv);
4719         Safefree(GvNAME(sv));
4720         /* If we're in a stash, we don't own a reference to it. However it does
4721            have a back reference to us, which needs to be cleared.  */
4722         if (GvSTASH(sv))
4723             sv_del_backref((SV*)GvSTASH(sv), sv);
4724     case SVt_PVMG:
4725     case SVt_PVNV:
4726     case SVt_PVIV:
4727       freescalar:
4728         /* Don't bother with SvOOK_off(sv); as we're only going to free it.  */
4729         if (SvOOK(sv)) {
4730             SvPV_set(sv, SvPVX_mutable(sv) - SvIVX(sv));
4731             /* Don't even bother with turning off the OOK flag.  */
4732         }
4733     case SVt_PV:
4734     case SVt_RV:
4735         if (SvROK(sv)) {
4736             SV *target = SvRV(sv);
4737             if (SvWEAKREF(sv))
4738                 sv_del_backref(target, sv);
4739             else
4740                 SvREFCNT_dec(target);
4741         }
4742 #ifdef PERL_OLD_COPY_ON_WRITE
4743         else if (SvPVX_const(sv)) {
4744             if (SvIsCOW(sv)) {
4745                 /* I believe I need to grab the global SV mutex here and
4746                    then recheck the COW status.  */
4747                 if (DEBUG_C_TEST) {
4748                     PerlIO_printf(Perl_debug_log, "Copy on write: clear\n");
4749                     sv_dump(sv);
4750                 }
4751                 sv_release_COW(sv, SvPVX_const(sv), SvLEN(sv),
4752                                SV_COW_NEXT_SV(sv));
4753                 /* And drop it here.  */
4754                 SvFAKE_off(sv);
4755             } else if (SvLEN(sv)) {
4756                 Safefree(SvPVX_const(sv));
4757             }
4758         }
4759 #else
4760         else if (SvPVX_const(sv) && SvLEN(sv))
4761             Safefree(SvPVX_mutable(sv));
4762         else if (SvPVX_const(sv) && SvREADONLY(sv) && SvFAKE(sv)) {
4763             unshare_hek(SvSHARED_HEK_FROM_PV(SvPVX_const(sv)));
4764             SvFAKE_off(sv);
4765         }
4766 #endif
4767         break;
4768     case SVt_NV:
4769         break;
4770     }
4771
4772     SvFLAGS(sv) &= SVf_BREAK;
4773     SvFLAGS(sv) |= SVTYPEMASK;
4774
4775     if (sv_type_details->arena) {
4776         del_body(((char *)SvANY(sv) + sv_type_details->offset),
4777                  &PL_body_roots[type]);
4778     }
4779     else if (sv_type_details->size) {
4780         my_safefree(SvANY(sv));
4781     }
4782 }
4783
4784 /*
4785 =for apidoc sv_newref
4786
4787 Increment an SV's reference count. Use the C<SvREFCNT_inc()> wrapper
4788 instead.
4789
4790 =cut
4791 */
4792
4793 SV *
4794 Perl_sv_newref(pTHX_ SV *sv)
4795 {
4796     if (sv)
4797         (SvREFCNT(sv))++;
4798     return sv;
4799 }
4800
4801 /*
4802 =for apidoc sv_free
4803
4804 Decrement an SV's reference count, and if it drops to zero, call
4805 C<sv_clear> to invoke destructors and free up any memory used by
4806 the body; finally, deallocate the SV's head itself.
4807 Normally called via a wrapper macro C<SvREFCNT_dec>.
4808
4809 =cut
4810 */
4811
4812 void
4813 Perl_sv_free(pTHX_ SV *sv)
4814 {
4815     dVAR;
4816     if (!sv)
4817         return;
4818     if (SvREFCNT(sv) == 0) {
4819         if (SvFLAGS(sv) & SVf_BREAK)
4820             /* this SV's refcnt has been artificially decremented to
4821              * trigger cleanup */
4822             return;
4823         if (PL_in_clean_all) /* All is fair */
4824             return;
4825         if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4826             /* make sure SvREFCNT(sv)==0 happens very seldom */
4827             SvREFCNT(sv) = (~(U32)0)/2;
4828             return;
4829         }
4830         if (ckWARN_d(WARN_INTERNAL)) {
4831             Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
4832                         "Attempt to free unreferenced scalar: SV 0x%"UVxf
4833                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4834 #ifdef DEBUG_LEAKING_SCALARS_FORK_DUMP
4835             Perl_dump_sv_child(aTHX_ sv);
4836 #endif
4837         }
4838         return;
4839     }
4840     if (--(SvREFCNT(sv)) > 0)
4841         return;
4842     Perl_sv_free2(aTHX_ sv);
4843 }
4844
4845 void
4846 Perl_sv_free2(pTHX_ SV *sv)
4847 {
4848     dVAR;
4849 #ifdef DEBUGGING
4850     if (SvTEMP(sv)) {
4851         if (ckWARN_d(WARN_DEBUGGING))
4852             Perl_warner(aTHX_ packWARN(WARN_DEBUGGING),
4853                         "Attempt to free temp prematurely: SV 0x%"UVxf
4854                         pTHX__FORMAT, PTR2UV(sv) pTHX__VALUE);
4855         return;
4856     }
4857 #endif
4858     if (SvREADONLY(sv) && SvIMMORTAL(sv)) {
4859         /* make sure SvREFCNT(sv)==0 happens very seldom */
4860         SvREFCNT(sv) = (~(U32)0)/2;
4861         return;
4862     }
4863     sv_clear(sv);
4864     if (! SvREFCNT(sv))
4865         del_SV(sv);
4866 }
4867
4868 /*
4869 =for apidoc sv_len
4870
4871 Returns the length of the string in the SV. Handles magic and type
4872 coercion.  See also C<SvCUR>, which gives raw access to the xpv_cur slot.
4873
4874 =cut
4875 */
4876
4877 STRLEN
4878 Perl_sv_len(pTHX_ register SV *sv)
4879 {
4880     STRLEN len;
4881
4882     if (!sv)
4883         return 0;
4884
4885     if (SvGMAGICAL(sv))
4886         len = mg_length(sv);
4887     else
4888         (void)SvPV_const(sv, len);
4889     return len;
4890 }
4891
4892 /*
4893 =for apidoc sv_len_utf8
4894
4895 Returns the number of characters in the string in an SV, counting wide
4896 UTF-8 bytes as a single character. Handles magic and type coercion.
4897
4898 =cut
4899 */
4900
4901 /*
4902  * The length is cached in PERL_UTF8_magic, in the mg_len field.  Also the
4903  * mg_ptr is used, by sv_pos_u2b(), see the comments of S_utf8_mg_pos_init().
4904  * (Note that the mg_len is not the length of the mg_ptr field.)
4905  *
4906  */
4907
4908 STRLEN
4909 Perl_sv_len_utf8(pTHX_ register SV *sv)
4910 {
4911     if (!sv)
4912         return 0;
4913
4914     if (SvGMAGICAL(sv))
4915         return mg_length(sv);
4916     else
4917     {
4918         STRLEN len, ulen;
4919         const U8 *s = (U8*)SvPV_const(sv, len);
4920         MAGIC *mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_utf8) : 0;
4921
4922         if (mg && mg->mg_len != -1 && (mg->mg_len > 0 || len == 0)) {
4923             ulen = mg->mg_len;
4924 #ifdef PERL_UTF8_CACHE_ASSERT
4925             assert(ulen == Perl_utf8_length(aTHX_ s, s + len));
4926 #endif
4927         }
4928         else {
4929             ulen = Perl_utf8_length(aTHX_ s, s + len);
4930             if (!mg && !SvREADONLY(sv)) {
4931                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
4932                 mg = mg_find(sv, PERL_MAGIC_utf8);
4933                 assert(mg);
4934             }
4935             if (mg)
4936                 mg->mg_len = ulen;
4937         }
4938         return ulen;
4939     }
4940 }
4941
4942 /* S_utf8_mg_pos_init() is used to initialize the mg_ptr field of
4943  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4944  * between UTF-8 and byte offsets.  There are two (substr offset and substr
4945  * length, the i offset, PERL_MAGIC_UTF8_CACHESIZE) times two (UTF-8 offset
4946  * and byte offset) cache positions.
4947  *
4948  * The mg_len field is used by sv_len_utf8(), see its comments.
4949  * Note that the mg_len is not the length of the mg_ptr field.
4950  *
4951  */
4952 STATIC bool
4953 S_utf8_mg_pos_init(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i,
4954                    I32 offsetp, const U8 *s, const U8 *start)
4955 {
4956     bool found = FALSE;
4957
4958     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4959         if (!*mgp)
4960             *mgp = sv_magicext(sv, 0, PERL_MAGIC_utf8, (MGVTBL*)&PL_vtbl_utf8, 0, 0);
4961         assert(*mgp);
4962
4963         if ((*mgp)->mg_ptr)
4964             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4965         else {
4966             Newxz(*cachep, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
4967             (*mgp)->mg_ptr = (char *) *cachep;
4968         }
4969         assert(*cachep);
4970
4971         (*cachep)[i]   = offsetp;
4972         (*cachep)[i+1] = s - start;
4973         found = TRUE;
4974     }
4975
4976     return found;
4977 }
4978
4979 /*
4980  * S_utf8_mg_pos() is used to query and update mg_ptr field of
4981  * a PERL_UTF8_magic.  The mg_ptr is used to store the mapping
4982  * between UTF-8 and byte offsets.  See also the comments of
4983  * S_utf8_mg_pos_init().
4984  *
4985  */
4986 STATIC bool
4987 S_utf8_mg_pos(pTHX_ SV *sv, MAGIC **mgp, STRLEN **cachep, I32 i, I32 *offsetp, I32 uoff, const U8 **sp, const U8 *start, const U8 *send)
4988 {
4989     bool found = FALSE;
4990
4991     if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
4992         if (!*mgp)
4993             *mgp = mg_find(sv, PERL_MAGIC_utf8);
4994         if (*mgp && (*mgp)->mg_ptr) {
4995             *cachep = (STRLEN *) (*mgp)->mg_ptr;
4996             ASSERT_UTF8_CACHE(*cachep);
4997             if ((*cachep)[i] == (STRLEN)uoff)   /* An exact match. */
4998                  found = TRUE;
4999             else {                      /* We will skip to the right spot. */
5000                  STRLEN forw  = 0;
5001                  STRLEN backw = 0;
5002                  const U8* p = NULL;
5003
5004                  /* The assumption is that going backward is half
5005                   * the speed of going forward (that's where the
5006                   * 2 * backw in the below comes from).  (The real
5007                   * figure of course depends on the UTF-8 data.) */
5008
5009                  if ((*cachep)[i] > (STRLEN)uoff) {
5010                       forw  = uoff;
5011                       backw = (*cachep)[i] - (STRLEN)uoff;
5012
5013                       if (forw < 2 * backw)
5014                            p = start;
5015                       else
5016                            p = start + (*cachep)[i+1];
5017                  }
5018                  /* Try this only for the substr offset (i == 0),
5019                   * not for the substr length (i == 2). */
5020                  else if (i == 0) { /* (*cachep)[i] < uoff */
5021                       const STRLEN ulen = sv_len_utf8(sv);
5022
5023                       if ((STRLEN)uoff < ulen) {
5024                            forw  = (STRLEN)uoff - (*cachep)[i];
5025                            backw = ulen - (STRLEN)uoff;
5026
5027                            if (forw < 2 * backw)
5028                                 p = start + (*cachep)[i+1];
5029                            else
5030                                 p = send;
5031                       }
5032
5033                       /* If the string is not long enough for uoff,
5034                        * we could extend it, but not at this low a level. */
5035                  }
5036
5037                  if (p) {
5038                       if (forw < 2 * backw) {
5039                            while (forw--)
5040                                 p += UTF8SKIP(p);
5041                       }
5042                       else {
5043                            while (backw--) {
5044                                 p--;
5045                                 while (UTF8_IS_CONTINUATION(*p))
5046                                      p--;
5047                            }
5048                       }
5049
5050                       /* Update the cache. */
5051                       (*cachep)[i]   = (STRLEN)uoff;
5052                       (*cachep)[i+1] = p - start;
5053
5054                       /* Drop the stale "length" cache */
5055                       if (i == 0) {
5056                           (*cachep)[2] = 0;
5057                           (*cachep)[3] = 0;
5058                       }
5059
5060                       found = TRUE;
5061                  }
5062             }
5063             if (found) {        /* Setup the return values. */
5064                  *offsetp = (*cachep)[i+1];
5065                  *sp = start + *offsetp;
5066                  if (*sp >= send) {
5067                       *sp = send;
5068                       *offsetp = send - start;
5069                  }
5070                  else if (*sp < start) {
5071                       *sp = start;
5072                       *offsetp = 0;
5073                  }
5074             }
5075         }
5076 #ifdef PERL_UTF8_CACHE_ASSERT
5077         if (found) {
5078              U8 *s = start;
5079              I32 n = uoff;
5080
5081              while (n-- && s < send)
5082                   s += UTF8SKIP(s);
5083
5084              if (i == 0) {
5085                   assert(*offsetp == s - start);
5086                   assert((*cachep)[0] == (STRLEN)uoff);
5087                   assert((*cachep)[1] == *offsetp);
5088              }
5089              ASSERT_UTF8_CACHE(*cachep);
5090         }
5091 #endif
5092     }
5093
5094     return found;
5095 }
5096
5097 /*
5098 =for apidoc sv_pos_u2b
5099
5100 Converts the value pointed to by offsetp from a count of UTF-8 chars from
5101 the start of the string, to a count of the equivalent number of bytes; if
5102 lenp is non-zero, it does the same to lenp, but this time starting from
5103 the offset, rather than from the start of the string. Handles magic and
5104 type coercion.
5105
5106 =cut
5107 */
5108
5109 /*
5110  * sv_pos_u2b() uses, like sv_pos_b2u(), the mg_ptr of the potential
5111  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5112  * byte offsets.  See also the comments of S_utf8_mg_pos().
5113  *
5114  */
5115
5116 void
5117 Perl_sv_pos_u2b(pTHX_ register SV *sv, I32* offsetp, I32* lenp)
5118 {
5119     const U8 *start;
5120     STRLEN len;
5121
5122     if (!sv)
5123         return;
5124
5125     start = (U8*)SvPV_const(sv, len);
5126     if (len) {
5127         STRLEN boffset = 0;
5128         STRLEN *cache = 0;
5129         const U8 *s = start;
5130         I32 uoffset = *offsetp;
5131         const U8 * const send = s + len;
5132         MAGIC *mg = 0;
5133         bool found = FALSE;
5134
5135          if (utf8_mg_pos(sv, &mg, &cache, 0, offsetp, *offsetp, &s, start, send))
5136              found = TRUE;
5137          if (!found && uoffset > 0) {
5138               while (s < send && uoffset--)
5139                    s += UTF8SKIP(s);
5140               if (s >= send)
5141                    s = send;
5142               if (utf8_mg_pos_init(sv, &mg, &cache, 0, *offsetp, s, start))
5143                   boffset = cache[1];
5144               *offsetp = s - start;
5145          }
5146          if (lenp) {
5147               found = FALSE;
5148               start = s;
5149               if (utf8_mg_pos(sv, &mg, &cache, 2, lenp, *lenp, &s, start, send)) {
5150                   *lenp -= boffset;
5151                   found = TRUE;
5152               }
5153               if (!found && *lenp > 0) {
5154                    I32 ulen = *lenp;
5155                    if (ulen > 0)
5156                         while (s < send && ulen--)
5157                              s += UTF8SKIP(s);
5158                    if (s >= send)
5159                         s = send;
5160                    utf8_mg_pos_init(sv, &mg, &cache, 2, *lenp, s, start);
5161               }
5162               *lenp = s - start;
5163          }
5164          ASSERT_UTF8_CACHE(cache);
5165     }
5166     else {
5167          *offsetp = 0;
5168          if (lenp)
5169               *lenp = 0;
5170     }
5171
5172     return;
5173 }
5174
5175 /*
5176 =for apidoc sv_pos_b2u
5177
5178 Converts the value pointed to by offsetp from a count of bytes from the
5179 start of the string, to a count of the equivalent number of UTF-8 chars.
5180 Handles magic and type coercion.
5181
5182 =cut
5183 */
5184
5185 /*
5186  * sv_pos_b2u() uses, like sv_pos_u2b(), the mg_ptr of the potential
5187  * PERL_UTF8_magic of the sv to store the mapping between UTF-8 and
5188  * byte offsets.  See also the comments of S_utf8_mg_pos().
5189  *
5190  */
5191
5192 void
5193 Perl_sv_pos_b2u(pTHX_ register SV* sv, I32* offsetp)
5194 {
5195     const U8* s;
5196     STRLEN len;
5197
5198     if (!sv)
5199         return;
5200
5201     s = (const U8*)SvPV_const(sv, len);
5202     if ((I32)len < *offsetp)
5203         Perl_croak(aTHX_ "panic: sv_pos_b2u: bad byte offset");
5204     else {
5205         const U8* send = s + *offsetp;
5206         MAGIC* mg = NULL;
5207         STRLEN *cache = NULL;
5208
5209         len = 0;
5210
5211         if (SvMAGICAL(sv) && !SvREADONLY(sv)) {
5212             mg = mg_find(sv, PERL_MAGIC_utf8);
5213             if (mg && mg->mg_ptr) {
5214                 cache = (STRLEN *) mg->mg_ptr;
5215                 if (cache[1] == (STRLEN)*offsetp) {
5216                     /* An exact match. */
5217                     *offsetp = cache[0];
5218
5219                     return;
5220                 }
5221                 else if (cache[1] < (STRLEN)*offsetp) {
5222                     /* We already know part of the way. */
5223                     len = cache[0];
5224                     s  += cache[1];
5225                     /* Let the below loop do the rest. */
5226                 }
5227                 else { /* cache[1] > *offsetp */
5228                     /* We already know all of the way, now we may
5229                      * be able to walk back.  The same assumption
5230                      * is made as in S_utf8_mg_pos(), namely that
5231                      * walking backward is twice slower than
5232                      * walking forward. */
5233                     const STRLEN forw  = *offsetp;
5234                     STRLEN backw = cache[1] - *offsetp;
5235
5236                     if (!(forw < 2 * backw)) {
5237                         const U8 *p = s + cache[1];
5238                         STRLEN ubackw = 0;
5239                         
5240                         cache[1] -= backw;
5241
5242                         while (backw--) {
5243                             p--;
5244                             while (UTF8_IS_CONTINUATION(*p)) {
5245                                 p--;
5246                                 backw--;
5247                             }
5248                             ubackw++;
5249                         }
5250
5251                         cache[0] -= ubackw;
5252                         *offsetp = cache[0];
5253
5254                         /* Drop the stale "length" cache */
5255                         cache[2] = 0;
5256                         cache[3] = 0;
5257
5258                         return;
5259                     }
5260                 }
5261             }
5262             ASSERT_UTF8_CACHE(cache);
5263         }
5264
5265         while (s < send) {
5266             STRLEN n = 1;
5267
5268             /* Call utf8n_to_uvchr() to validate the sequence
5269              * (unless a simple non-UTF character) */
5270             if (!UTF8_IS_INVARIANT(*s))
5271                 utf8n_to_uvchr(s, UTF8SKIP(s), &n, 0);
5272             if (n > 0) {
5273                 s += n;
5274                 len++;
5275             }
5276             else
5277                 break;
5278         }
5279
5280         if (!SvREADONLY(sv)) {
5281             if (!mg) {
5282                 sv_magic(sv, 0, PERL_MAGIC_utf8, 0, 0);
5283                 mg = mg_find(sv, PERL_MAGIC_utf8);
5284             }
5285             assert(mg);
5286
5287             if (!mg->mg_ptr) {
5288                 Newxz(cache, PERL_MAGIC_UTF8_CACHESIZE * 2, STRLEN);
5289                 mg->mg_ptr = (char *) cache;
5290             }
5291             assert(cache);
5292
5293             cache[0] = len;
5294             cache[1] = *offsetp;
5295             /* Drop the stale "length" cache */
5296             cache[2] = 0;
5297             cache[3] = 0;
5298         }
5299
5300         *offsetp = len;
5301     }
5302     return;
5303 }
5304
5305 /*
5306 =for apidoc sv_eq
5307
5308 Returns a boolean indicating whether the strings in the two SVs are
5309 identical. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5310 coerce its args to strings if necessary.
5311
5312 =cut
5313 */
5314
5315 I32
5316 Perl_sv_eq(pTHX_ register SV *sv1, register SV *sv2)
5317 {
5318     const char *pv1;
5319     STRLEN cur1;
5320     const char *pv2;
5321     STRLEN cur2;
5322     I32  eq     = 0;
5323     char *tpv   = Nullch;
5324     SV* svrecode = Nullsv;
5325
5326     if (!sv1) {
5327         pv1 = "";
5328         cur1 = 0;
5329     }
5330     else
5331         pv1 = SvPV_const(sv1, cur1);
5332
5333     if (!sv2){
5334         pv2 = "";
5335         cur2 = 0;
5336     }
5337     else
5338         pv2 = SvPV_const(sv2, cur2);
5339
5340     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5341         /* Differing utf8ness.
5342          * Do not UTF8size the comparands as a side-effect. */
5343          if (PL_encoding) {
5344               if (SvUTF8(sv1)) {
5345                    svrecode = newSVpvn(pv2, cur2);
5346                    sv_recode_to_utf8(svrecode, PL_encoding);
5347                    pv2 = SvPV_const(svrecode, cur2);
5348               }
5349               else {
5350                    svrecode = newSVpvn(pv1, cur1);
5351                    sv_recode_to_utf8(svrecode, PL_encoding);
5352                    pv1 = SvPV_const(svrecode, cur1);
5353               }
5354               /* Now both are in UTF-8. */
5355               if (cur1 != cur2) {
5356                    SvREFCNT_dec(svrecode);
5357                    return FALSE;
5358               }
5359          }
5360          else {
5361               bool is_utf8 = TRUE;
5362
5363               if (SvUTF8(sv1)) {
5364                    /* sv1 is the UTF-8 one,
5365                     * if is equal it must be downgrade-able */
5366                    char * const pv = (char*)bytes_from_utf8((const U8*)pv1,
5367                                                      &cur1, &is_utf8);
5368                    if (pv != pv1)
5369                         pv1 = tpv = pv;
5370               }
5371               else {
5372                    /* sv2 is the UTF-8 one,
5373                     * if is equal it must be downgrade-able */
5374                    char * const pv = (char *)bytes_from_utf8((const U8*)pv2,
5375                                                       &cur2, &is_utf8);
5376                    if (pv != pv2)
5377                         pv2 = tpv = pv;
5378               }
5379               if (is_utf8) {
5380                    /* Downgrade not possible - cannot be eq */
5381                    assert (tpv == 0);
5382                    return FALSE;
5383               }
5384          }
5385     }
5386
5387     if (cur1 == cur2)
5388         eq = (pv1 == pv2) || memEQ(pv1, pv2, cur1);
5389         
5390     if (svrecode)
5391          SvREFCNT_dec(svrecode);
5392
5393     if (tpv)
5394         Safefree(tpv);
5395
5396     return eq;
5397 }
5398
5399 /*
5400 =for apidoc sv_cmp
5401
5402 Compares the strings in two SVs.  Returns -1, 0, or 1 indicating whether the
5403 string in C<sv1> is less than, equal to, or greater than the string in
5404 C<sv2>. Is UTF-8 and 'use bytes' aware, handles get magic, and will
5405 coerce its args to strings if necessary.  See also C<sv_cmp_locale>.
5406
5407 =cut
5408 */
5409
5410 I32
5411 Perl_sv_cmp(pTHX_ register SV *sv1, register SV *sv2)
5412 {
5413     STRLEN cur1, cur2;
5414     const char *pv1, *pv2;
5415     char *tpv = Nullch;
5416     I32  cmp;
5417     SV *svrecode = Nullsv;
5418
5419     if (!sv1) {
5420         pv1 = "";
5421         cur1 = 0;
5422     }
5423     else
5424         pv1 = SvPV_const(sv1, cur1);
5425
5426     if (!sv2) {
5427         pv2 = "";
5428         cur2 = 0;
5429     }
5430     else
5431         pv2 = SvPV_const(sv2, cur2);
5432
5433     if (cur1 && cur2 && SvUTF8(sv1) != SvUTF8(sv2) && !IN_BYTES) {
5434         /* Differing utf8ness.
5435          * Do not UTF8size the comparands as a side-effect. */
5436         if (SvUTF8(sv1)) {
5437             if (PL_encoding) {
5438                  svrecode = newSVpvn(pv2, cur2);
5439                  sv_recode_to_utf8(svrecode, PL_encoding);
5440                  pv2 = SvPV_const(svrecode, cur2);
5441             }
5442             else {
5443                  pv2 = tpv = (char*)bytes_to_utf8((const U8*)pv2, &cur2);
5444             }
5445         }
5446         else {
5447             if (PL_encoding) {
5448                  svrecode = newSVpvn(pv1, cur1);
5449                  sv_recode_to_utf8(svrecode, PL_encoding);
5450                  pv1 = SvPV_const(svrecode, cur1);
5451             }
5452             else {
5453                  pv1 = tpv = (char*)bytes_to_utf8((const U8*)pv1, &cur1);
5454             }
5455         }
5456     }
5457
5458     if (!cur1) {
5459         cmp = cur2 ? -1 : 0;
5460     } else if (!cur2) {
5461         cmp = 1;
5462     } else {
5463         const I32 retval = memcmp((const void*)pv1, (const void*)pv2, cur1 < cur2 ? cur1 : cur2);
5464
5465         if (retval) {
5466             cmp = retval < 0 ? -1 : 1;
5467         } else if (cur1 == cur2) {
5468             cmp = 0;
5469         } else {
5470             cmp = cur1 < cur2 ? -1 : 1;
5471         }
5472     }
5473
5474     if (svrecode)
5475          SvREFCNT_dec(svrecode);
5476
5477     if (tpv)
5478         Safefree(tpv);
5479
5480     return cmp;
5481 }
5482
5483 /*
5484 =for apidoc sv_cmp_locale
5485
5486 Compares the strings in two SVs in a locale-aware manner. Is UTF-8 and
5487 'use bytes' aware, handles get magic, and will coerce its args to strings
5488 if necessary.  See also C<sv_cmp_locale>.  See also C<sv_cmp>.
5489
5490 =cut
5491 */
5492
5493 I32
5494 Perl_sv_cmp_locale(pTHX_ register SV *sv1, register SV *sv2)
5495 {
5496 #ifdef USE_LOCALE_COLLATE
5497
5498     char *pv1, *pv2;
5499     STRLEN len1, len2;
5500     I32 retval;
5501
5502     if (PL_collation_standard)
5503         goto raw_compare;
5504
5505     len1 = 0;
5506     pv1 = sv1 ? sv_collxfrm(sv1, &len1) : (char *) NULL;
5507     len2 = 0;
5508     pv2 = sv2 ? sv_collxfrm(sv2, &len2) : (char *) NULL;
5509
5510     if (!pv1 || !len1) {
5511         if (pv2 && len2)
5512             return -1;
5513         else
5514             goto raw_compare;
5515     }
5516     else {
5517         if (!pv2 || !len2)
5518             return 1;
5519     }
5520
5521     retval = memcmp((void*)pv1, (void*)pv2, len1 < len2 ? len1 : len2);
5522
5523     if (retval)
5524         return retval < 0 ? -1 : 1;
5525
5526     /*
5527      * When the result of collation is equality, that doesn't mean
5528      * that there are no differences -- some locales exclude some
5529      * characters from consideration.  So to avoid false equalities,
5530      * we use the raw string as a tiebreaker.
5531      */
5532
5533   raw_compare:
5534     /* FALL THROUGH */
5535
5536 #endif /* USE_LOCALE_COLLATE */
5537
5538     return sv_cmp(sv1, sv2);
5539 }
5540
5541
5542 #ifdef USE_LOCALE_COLLATE
5543
5544 /*
5545 =for apidoc sv_collxfrm
5546
5547 Add Collate Transform magic to an SV if it doesn't already have it.
5548
5549 Any scalar variable may carry PERL_MAGIC_collxfrm magic that contains the
5550 scalar data of the variable, but transformed to such a format that a normal
5551 memory comparison can be used to compare the data according to the locale
5552 settings.
5553
5554 =cut
5555 */
5556
5557 char *
5558 Perl_sv_collxfrm(pTHX_ SV *sv, STRLEN *nxp)
5559 {
5560     MAGIC *mg;
5561
5562     mg = SvMAGICAL(sv) ? mg_find(sv, PERL_MAGIC_collxfrm) : (MAGIC *) NULL;
5563     if (!mg || !mg->mg_ptr || *(U32*)mg->mg_ptr != PL_collation_ix) {
5564         const char *s;
5565         char *xf;
5566         STRLEN len, xlen;
5567
5568         if (mg)
5569             Safefree(mg->mg_ptr);
5570         s = SvPV_const(sv, len);
5571         if ((xf = mem_collxfrm(s, len, &xlen))) {
5572             if (SvREADONLY(sv)) {
5573                 SAVEFREEPV(xf);
5574                 *nxp = xlen;
5575                 return xf + sizeof(PL_collation_ix);
5576             }
5577             if (! mg) {
5578                 sv_magic(sv, 0, PERL_MAGIC_collxfrm, 0, 0);
5579                 mg = mg_find(sv, PERL_MAGIC_collxfrm);
5580                 assert(mg);
5581             }
5582             mg->mg_ptr = xf;
5583             mg->mg_len = xlen;
5584         }
5585         else {
5586             if (mg) {
5587                 mg->mg_ptr = NULL;
5588                 mg->mg_len = -1;
5589             }
5590         }
5591     }
5592     if (mg && mg->mg_ptr) {
5593         *nxp = mg->mg_len;
5594         return mg->mg_ptr + sizeof(PL_collation_ix);
5595     }
5596     else {
5597         *nxp = 0;
5598         return NULL;
5599     }
5600 }
5601
5602 #endif /* USE_LOCALE_COLLATE */
5603
5604 /*
5605 =for apidoc sv_gets
5606
5607 Get a line from the filehandle and store it into the SV, optionally
5608 appending to the currently-stored string.
5609
5610 =cut
5611 */
5612
5613 char *
5614 Perl_sv_gets(pTHX_ register SV *sv, register PerlIO *fp, I32 append)
5615 {
5616     const char *rsptr;
5617     STRLEN rslen;
5618     register STDCHAR rslast;
5619     register STDCHAR *bp;
5620     register I32 cnt;
5621     I32 i = 0;
5622     I32 rspara = 0;
5623     I32 recsize;
5624
5625     if (SvTHINKFIRST(sv))
5626         sv_force_normal_flags(sv, append ? 0 : SV_COW_DROP_PV);
5627     /* XXX. If you make this PVIV, then copy on write can copy scalars read
5628        from <>.
5629        However, perlbench says it's slower, because the existing swipe code
5630        is faster than copy on write.
5631        Swings and roundabouts.  */
5632     SvUPGRADE(sv, SVt_PV);
5633
5634     SvSCREAM_off(sv);
5635
5636     if (append) {
5637         if (PerlIO_isutf8(fp)) {
5638             if (!SvUTF8(sv)) {
5639                 sv_utf8_upgrade_nomg(sv);
5640                 sv_pos_u2b(sv,&append,0);
5641             }
5642         } else if (SvUTF8(sv)) {
5643             SV * const tsv = NEWSV(0,0);
5644             sv_gets(tsv, fp, 0);
5645             sv_utf8_upgrade_nomg(tsv);
5646             SvCUR_set(sv,append);
5647             sv_catsv(sv,tsv);
5648             sv_free(tsv);
5649             goto return_string_or_null;
5650         }
5651     }
5652
5653     SvPOK_only(sv);
5654     if (PerlIO_isutf8(fp))
5655         SvUTF8_on(sv);
5656
5657     if (IN_PERL_COMPILETIME) {
5658         /* we always read code in line mode */
5659         rsptr = "\n";
5660         rslen = 1;
5661     }
5662     else if (RsSNARF(PL_rs)) {
5663         /* If it is a regular disk file use size from stat() as estimate
5664            of amount we are going to read - may result in malloc-ing
5665            more memory than we realy need if layers bellow reduce
5666            size we read (e.g. CRLF or a gzip layer)
5667          */
5668         Stat_t st;
5669         if (!PerlLIO_fstat(PerlIO_fileno(fp), &st) && S_ISREG(st.st_mode))  {
5670             const Off_t offset = PerlIO_tell(fp);
5671             if (offset != (Off_t) -1 && st.st_size + append > offset) {
5672                 (void) SvGROW(sv, (STRLEN)((st.st_size - offset) + append + 1));
5673             }
5674         }
5675         rsptr = NULL;
5676         rslen = 0;
5677     }
5678     else if (RsRECORD(PL_rs)) {
5679       I32 bytesread;
5680       char *buffer;
5681
5682       /* Grab the size of the record we're getting */
5683       recsize = SvIV(SvRV(PL_rs));
5684       buffer = SvGROW(sv, (STRLEN)(recsize + append + 1)) + append;
5685       /* Go yank in */
5686 #ifdef VMS
5687       /* VMS wants read instead of fread, because fread doesn't respect */
5688       /* RMS record boundaries. This is not necessarily a good thing to be */
5689       /* doing, but we've got no other real choice - except avoid stdio
5690          as implementation - perhaps write a :vms layer ?
5691        */
5692       bytesread = PerlLIO_read(PerlIO_fileno(fp), buffer, recsize);
5693 #else
5694       bytesread = PerlIO_read(fp, buffer, recsize);
5695 #endif
5696       if (bytesread < 0)
5697           bytesread = 0;
5698       SvCUR_set(sv, bytesread += append);
5699       buffer[bytesread] = '\0';
5700       goto return_string_or_null;
5701     }
5702     else if (RsPARA(PL_rs)) {
5703         rsptr = "\n\n";
5704         rslen = 2;
5705         rspara = 1;
5706     }
5707     else {
5708         /* Get $/ i.e. PL_rs into same encoding as stream wants */
5709         if (PerlIO_isutf8(fp)) {
5710             rsptr = SvPVutf8(PL_rs, rslen);
5711         }
5712         else {
5713             if (SvUTF8(PL_rs)) {
5714                 if (!sv_utf8_downgrade(PL_rs, TRUE)) {
5715                     Perl_croak(aTHX_ "Wide character in $/");
5716                 }
5717             }
5718             rsptr = SvPV_const(PL_rs, rslen);
5719         }
5720     }
5721
5722     rslast = rslen ? rsptr[rslen - 1] : '\0';
5723
5724     if (rspara) {               /* have to do this both before and after */
5725         do {                    /* to make sure file boundaries work right */
5726             if (PerlIO_eof(fp))
5727                 return 0;
5728             i = PerlIO_getc(fp);
5729             if (i != '\n') {
5730                 if (i == -1)
5731                     return 0;
5732                 PerlIO_ungetc(fp,i);
5733                 break;
5734             }
5735         } while (i != EOF);
5736     }
5737
5738     /* See if we know enough about I/O mechanism to cheat it ! */
5739
5740     /* This used to be #ifdef test - it is made run-time test for ease
5741        of abstracting out stdio interface. One call should be cheap
5742        enough here - and may even be a macro allowing compile
5743        time optimization.
5744      */
5745
5746     if (PerlIO_fast_gets(fp)) {
5747
5748     /*
5749      * We're going to steal some values from the stdio struct
5750      * and put EVERYTHING in the innermost loop into registers.
5751      */
5752     register STDCHAR *ptr;
5753     STRLEN bpx;
5754     I32 shortbuffered;
5755
5756 #if defined(VMS) && defined(PERLIO_IS_STDIO)
5757     /* An ungetc()d char is handled separately from the regular
5758      * buffer, so we getc() it back out and stuff it in the buffer.
5759      */
5760     i = PerlIO_getc(fp);
5761     if (i == EOF) return 0;
5762     *(--((*fp)->_ptr)) = (unsigned char) i;
5763     (*fp)->_cnt++;
5764 #endif
5765
5766     /* Here is some breathtakingly efficient cheating */
5767
5768     cnt = PerlIO_get_cnt(fp);                   /* get count into register */
5769     /* make sure we have the room */
5770     if ((I32)(SvLEN(sv) - append) <= cnt + 1) {
5771         /* Not room for all of it
5772            if we are looking for a separator and room for some
5773          */
5774         if (rslen && cnt > 80 && (I32)SvLEN(sv) > append) {
5775             /* just process what we have room for */
5776             shortbuffered = cnt - SvLEN(sv) + append + 1;
5777             cnt -= shortbuffered;
5778         }
5779         else {
5780             shortbuffered = 0;
5781             /* remember that cnt can be negative */
5782             SvGROW(sv, (STRLEN)(append + (cnt <= 0 ? 2 : (cnt + 1))));
5783         }
5784     }
5785     else
5786         shortbuffered = 0;
5787     bp = (STDCHAR*)SvPVX_const(sv) + append;  /* move these two too to registers */
5788     ptr = (STDCHAR*)PerlIO_get_ptr(fp);
5789     DEBUG_P(PerlIO_printf(Perl_debug_log,
5790         "Screamer: entering, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5791     DEBUG_P(PerlIO_printf(Perl_debug_log,
5792         "Screamer: entering: PerlIO * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5793                PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5794                PTR2UV(PerlIO_has_base(fp) ? PerlIO_get_base(fp) : 0)));
5795     for (;;) {
5796       screamer:
5797         if (cnt > 0) {
5798             if (rslen) {
5799                 while (cnt > 0) {                    /* this     |  eat */
5800                     cnt--;
5801                     if ((*bp++ = *ptr++) == rslast)  /* really   |  dust */
5802                         goto thats_all_folks;        /* screams  |  sed :-) */
5803                 }
5804             }
5805             else {
5806                 Copy(ptr, bp, cnt, char);            /* this     |  eat */
5807                 bp += cnt;                           /* screams  |  dust */
5808                 ptr += cnt;                          /* louder   |  sed :-) */
5809                 cnt = 0;
5810             }
5811         }
5812         
5813         if (shortbuffered) {            /* oh well, must extend */
5814             cnt = shortbuffered;
5815             shortbuffered = 0;
5816             bpx = bp - (STDCHAR*)SvPVX_const(sv); /* box up before relocation */
5817             SvCUR_set(sv, bpx);
5818             SvGROW(sv, SvLEN(sv) + append + cnt + 2);
5819             bp = (STDCHAR*)SvPVX_const(sv) + bpx; /* unbox after relocation */
5820             continue;
5821         }
5822
5823         DEBUG_P(PerlIO_printf(Perl_debug_log,
5824                               "Screamer: going to getc, ptr=%"UVuf", cnt=%ld\n",
5825                               PTR2UV(ptr),(long)cnt));
5826         PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt); /* deregisterize cnt and ptr */
5827 #if 0
5828         DEBUG_P(PerlIO_printf(Perl_debug_log,
5829             "Screamer: pre: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5830             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5831             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5832 #endif
5833         /* This used to call 'filbuf' in stdio form, but as that behaves like
5834            getc when cnt <= 0 we use PerlIO_getc here to avoid introducing
5835            another abstraction.  */
5836         i   = PerlIO_getc(fp);          /* get more characters */
5837 #if 0
5838         DEBUG_P(PerlIO_printf(Perl_debug_log,
5839             "Screamer: post: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5840             PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5841             PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5842 #endif
5843         cnt = PerlIO_get_cnt(fp);
5844         ptr = (STDCHAR*)PerlIO_get_ptr(fp);     /* reregisterize cnt and ptr */
5845         DEBUG_P(PerlIO_printf(Perl_debug_log,
5846             "Screamer: after getc, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5847
5848         if (i == EOF)                   /* all done for ever? */
5849             goto thats_really_all_folks;
5850
5851         bpx = bp - (STDCHAR*)SvPVX_const(sv);   /* box up before relocation */
5852         SvCUR_set(sv, bpx);
5853         SvGROW(sv, bpx + cnt + 2);
5854         bp = (STDCHAR*)SvPVX_const(sv) + bpx;   /* unbox after relocation */
5855
5856         *bp++ = (STDCHAR)i;             /* store character from PerlIO_getc */
5857
5858         if (rslen && (STDCHAR)i == rslast)  /* all done for now? */
5859             goto thats_all_folks;
5860     }
5861
5862 thats_all_folks:
5863     if ((rslen > 1 && (STRLEN)(bp - (STDCHAR*)SvPVX_const(sv)) < rslen) ||
5864           memNE((char*)bp - rslen, rsptr, rslen))
5865         goto screamer;                          /* go back to the fray */
5866 thats_really_all_folks:
5867     if (shortbuffered)
5868         cnt += shortbuffered;
5869         DEBUG_P(PerlIO_printf(Perl_debug_log,
5870             "Screamer: quitting, ptr=%"UVuf", cnt=%ld\n",PTR2UV(ptr),(long)cnt));
5871     PerlIO_set_ptrcnt(fp, (STDCHAR*)ptr, cnt);  /* put these back or we're in trouble */
5872     DEBUG_P(PerlIO_printf(Perl_debug_log,
5873         "Screamer: end: FILE * thinks ptr=%"UVuf", cnt=%ld, base=%"UVuf"\n",
5874         PTR2UV(PerlIO_get_ptr(fp)), (long)PerlIO_get_cnt(fp),
5875         PTR2UV(PerlIO_has_base (fp) ? PerlIO_get_base(fp) : 0)));
5876     *bp = '\0';
5877     SvCUR_set(sv, bp - (STDCHAR*)SvPVX_const(sv));      /* set length */
5878     DEBUG_P(PerlIO_printf(Perl_debug_log,
5879         "Screamer: done, len=%ld, string=|%.*s|\n",
5880         (long)SvCUR(sv),(int)SvCUR(sv),SvPVX_const(sv)));
5881     }
5882    else
5883     {
5884        /*The big, slow, and stupid way. */
5885 #ifdef USE_HEAP_INSTEAD_OF_STACK        /* Even slower way. */
5886         STDCHAR *buf = 0;
5887         Newx(buf, 8192, STDCHAR);
5888         assert(buf);
5889 #else
5890         STDCHAR buf[8192];
5891 #endif
5892
5893 screamer2:
5894         if (rslen) {
5895             register const STDCHAR *bpe = buf + sizeof(buf);
5896             bp = buf;
5897             while ((i = PerlIO_getc(fp)) != EOF && (*bp++ = (STDCHAR)i) != rslast && bp < bpe)
5898                 ; /* keep reading */
5899             cnt = bp - buf;
5900         }
5901         else {
5902             cnt = PerlIO_read(fp,(char*)buf, sizeof(buf));
5903             /* Accomodate broken VAXC compiler, which applies U8 cast to
5904              * both args of ?: operator, causing EOF to change into 255
5905              */
5906             if (cnt > 0)
5907                  i = (U8)buf[cnt - 1];
5908             else
5909                  i = EOF;
5910         }
5911
5912         if (cnt < 0)
5913             cnt = 0;  /* we do need to re-set the sv even when cnt <= 0 */
5914         if (append)
5915              sv_catpvn(sv, (char *) buf, cnt);
5916         else
5917              sv_setpvn(sv, (char *) buf, cnt);
5918
5919         if (i != EOF &&                 /* joy */
5920             (!rslen ||
5921              SvCUR(sv) < rslen ||
5922              memNE(SvPVX_const(sv) + SvCUR(sv) - rslen, rsptr, rslen)))
5923         {
5924             append = -1;
5925             /*
5926              * If we're reading from a TTY and we get a short read,
5927              * indicating that the user hit his EOF character, we need
5928              * to notice it now, because if we try to read from the TTY
5929              * again, the EOF condition will disappear.
5930              *
5931              * The comparison of cnt to sizeof(buf) is an optimization
5932              * that prevents unnecessary calls to feof().
5933              *
5934              * - jik 9/25/96
5935              */
5936             if (!(cnt < sizeof(buf) && PerlIO_eof(fp)))
5937                 goto screamer2;
5938         }
5939
5940 #ifdef USE_HEAP_INSTEAD_OF_STACK
5941         Safefree(buf);
5942 #endif
5943     }
5944
5945     if (rspara) {               /* have to do this both before and after */
5946         while (i != EOF) {      /* to make sure file boundaries work right */
5947             i = PerlIO_getc(fp);
5948             if (i != '\n') {
5949                 PerlIO_ungetc(fp,i);
5950                 break;
5951             }
5952         }
5953     }
5954
5955 return_string_or_null:
5956     return (SvCUR(sv) - append) ? SvPVX(sv) : Nullch;
5957 }
5958
5959 /*
5960 =for apidoc sv_inc
5961
5962 Auto-increment of the value in the SV, doing string to numeric conversion
5963 if necessary. Handles 'get' magic.
5964
5965 =cut
5966 */
5967
5968 void
5969 Perl_sv_inc(pTHX_ register SV *sv)
5970 {
5971     register char *d;
5972     int flags;
5973
5974     if (!sv)
5975         return;
5976     SvGETMAGIC(sv);
5977     if (SvTHINKFIRST(sv)) {
5978         if (SvIsCOW(sv))
5979             sv_force_normal_flags(sv, 0);
5980         if (SvREADONLY(sv)) {
5981             if (IN_PERL_RUNTIME)
5982                 Perl_croak(aTHX_ PL_no_modify);
5983         }
5984         if (SvROK(sv)) {
5985             IV i;
5986             if (SvAMAGIC(sv) && AMG_CALLun(sv,inc))
5987                 return;
5988             i = PTR2IV(SvRV(sv));
5989             sv_unref(sv);
5990             sv_setiv(sv, i);
5991         }
5992     }
5993     flags = SvFLAGS(sv);
5994     if ((flags & (SVp_NOK|SVp_IOK)) == SVp_NOK) {
5995         /* It's (privately or publicly) a float, but not tested as an
5996            integer, so test it to see. */
5997         (void) SvIV(sv);
5998         flags = SvFLAGS(sv);
5999     }
6000     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6001         /* It's publicly an integer, or privately an integer-not-float */
6002 #ifdef PERL_PRESERVE_IVUV
6003       oops_its_int:
6004 #endif
6005         if (SvIsUV(sv)) {
6006             if (SvUVX(sv) == UV_MAX)
6007                 sv_setnv(sv, UV_MAX_P1);
6008             else
6009                 (void)SvIOK_only_UV(sv);
6010                 SvUV_set(sv, SvUVX(sv) + 1);
6011         } else {
6012             if (SvIVX(sv) == IV_MAX)
6013                 sv_setuv(sv, (UV)IV_MAX + 1);
6014             else {
6015                 (void)SvIOK_only(sv);
6016                 SvIV_set(sv, SvIVX(sv) + 1);
6017             }   
6018         }
6019         return;
6020     }
6021     if (flags & SVp_NOK) {
6022         (void)SvNOK_only(sv);
6023         SvNV_set(sv, SvNVX(sv) + 1.0);
6024         return;
6025     }
6026
6027     if (!(flags & SVp_POK) || !*SvPVX_const(sv)) {
6028         if ((flags & SVTYPEMASK) < SVt_PVIV)
6029             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV ? SVt_PVIV : SVt_IV));
6030         (void)SvIOK_only(sv);
6031         SvIV_set(sv, 1);
6032         return;
6033     }
6034     d = SvPVX(sv);
6035     while (isALPHA(*d)) d++;
6036     while (isDIGIT(*d)) d++;
6037     if (*d) {
6038 #ifdef PERL_PRESERVE_IVUV
6039         /* Got to punt this as an integer if needs be, but we don't issue
6040            warnings. Probably ought to make the sv_iv_please() that does
6041            the conversion if possible, and silently.  */
6042         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6043         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6044             /* Need to try really hard to see if it's an integer.
6045                9.22337203685478e+18 is an integer.
6046                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6047                so $a="9.22337203685478e+18"; $a+0; $a++
6048                needs to be the same as $a="9.22337203685478e+18"; $a++
6049                or we go insane. */
6050         
6051             (void) sv_2iv(sv);
6052             if (SvIOK(sv))
6053                 goto oops_its_int;
6054
6055             /* sv_2iv *should* have made this an NV */
6056             if (flags & SVp_NOK) {
6057                 (void)SvNOK_only(sv);
6058                 SvNV_set(sv, SvNVX(sv) + 1.0);
6059                 return;
6060             }
6061             /* I don't think we can get here. Maybe I should assert this
6062                And if we do get here I suspect that sv_setnv will croak. NWC
6063                Fall through. */
6064 #if defined(USE_LONG_DOUBLE)
6065             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6066                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6067 #else
6068             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_inc punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6069                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6070 #endif
6071         }
6072 #endif /* PERL_PRESERVE_IVUV */
6073         sv_setnv(sv,Atof(SvPVX_const(sv)) + 1.0);
6074         return;
6075     }
6076     d--;
6077     while (d >= SvPVX_const(sv)) {
6078         if (isDIGIT(*d)) {
6079             if (++*d <= '9')
6080                 return;
6081             *(d--) = '0';
6082         }
6083         else {
6084 #ifdef EBCDIC
6085             /* MKS: The original code here died if letters weren't consecutive.
6086              * at least it didn't have to worry about non-C locales.  The
6087              * new code assumes that ('z'-'a')==('Z'-'A'), letters are
6088              * arranged in order (although not consecutively) and that only
6089              * [A-Za-z] are accepted by isALPHA in the C locale.
6090              */
6091             if (*d != 'z' && *d != 'Z') {
6092                 do { ++*d; } while (!isALPHA(*d));
6093                 return;
6094             }
6095             *(d--) -= 'z' - 'a';
6096 #else
6097             ++*d;
6098             if (isALPHA(*d))
6099                 return;
6100             *(d--) -= 'z' - 'a' + 1;
6101 #endif
6102         }
6103     }
6104     /* oh,oh, the number grew */
6105     SvGROW(sv, SvCUR(sv) + 2);
6106     SvCUR_set(sv, SvCUR(sv) + 1);
6107     for (d = SvPVX(sv) + SvCUR(sv); d > SvPVX_const(sv); d--)
6108         *d = d[-1];
6109     if (isDIGIT(d[1]))
6110         *d = '1';
6111     else
6112         *d = d[1];
6113 }
6114
6115 /*
6116 =for apidoc sv_dec
6117
6118 Auto-decrement of the value in the SV, doing string to numeric conversion
6119 if necessary. Handles 'get' magic.
6120
6121 =cut
6122 */
6123
6124 void
6125 Perl_sv_dec(pTHX_ register SV *sv)
6126 {
6127     int flags;
6128
6129     if (!sv)
6130         return;
6131     SvGETMAGIC(sv);
6132     if (SvTHINKFIRST(sv)) {
6133         if (SvIsCOW(sv))
6134             sv_force_normal_flags(sv, 0);
6135         if (SvREADONLY(sv)) {
6136             if (IN_PERL_RUNTIME)
6137                 Perl_croak(aTHX_ PL_no_modify);
6138         }
6139         if (SvROK(sv)) {
6140             IV i;
6141             if (SvAMAGIC(sv) && AMG_CALLun(sv,dec))
6142                 return;
6143             i = PTR2IV(SvRV(sv));
6144             sv_unref(sv);
6145             sv_setiv(sv, i);
6146         }
6147     }
6148     /* Unlike sv_inc we don't have to worry about string-never-numbers
6149        and keeping them magic. But we mustn't warn on punting */
6150     flags = SvFLAGS(sv);
6151     if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
6152         /* It's publicly an integer, or privately an integer-not-float */
6153 #ifdef PERL_PRESERVE_IVUV
6154       oops_its_int:
6155 #endif
6156         if (SvIsUV(sv)) {
6157             if (SvUVX(sv) == 0) {
6158                 (void)SvIOK_only(sv);
6159                 SvIV_set(sv, -1);
6160             }
6161             else {
6162                 (void)SvIOK_only_UV(sv);
6163                 SvUV_set(sv, SvUVX(sv) - 1);
6164             }   
6165         } else {
6166             if (SvIVX(sv) == IV_MIN)
6167                 sv_setnv(sv, (NV)IV_MIN - 1.0);
6168             else {
6169                 (void)SvIOK_only(sv);
6170                 SvIV_set(sv, SvIVX(sv) - 1);
6171             }   
6172         }
6173         return;
6174     }
6175     if (flags & SVp_NOK) {
6176         SvNV_set(sv, SvNVX(sv) - 1.0);
6177         (void)SvNOK_only(sv);
6178         return;
6179     }
6180     if (!(flags & SVp_POK)) {
6181         if ((flags & SVTYPEMASK) < SVt_PVIV)
6182             sv_upgrade(sv, ((flags & SVTYPEMASK) > SVt_IV) ? SVt_PVIV : SVt_IV);
6183         SvIV_set(sv, -1);
6184         (void)SvIOK_only(sv);
6185         return;
6186     }
6187 #ifdef PERL_PRESERVE_IVUV
6188     {
6189         const int numtype = grok_number(SvPVX_const(sv), SvCUR(sv), NULL);
6190         if (numtype && !(numtype & IS_NUMBER_INFINITY)) {
6191             /* Need to try really hard to see if it's an integer.
6192                9.22337203685478e+18 is an integer.
6193                but "9.22337203685478e+18" + 0 is UV=9223372036854779904
6194                so $a="9.22337203685478e+18"; $a+0; $a--
6195                needs to be the same as $a="9.22337203685478e+18"; $a--
6196                or we go insane. */
6197         
6198             (void) sv_2iv(sv);
6199             if (SvIOK(sv))
6200                 goto oops_its_int;
6201
6202             /* sv_2iv *should* have made this an NV */
6203             if (flags & SVp_NOK) {
6204                 (void)SvNOK_only(sv);
6205                 SvNV_set(sv, SvNVX(sv) - 1.0);
6206                 return;
6207             }
6208             /* I don't think we can get here. Maybe I should assert this
6209                And if we do get here I suspect that sv_setnv will croak. NWC
6210                Fall through. */
6211 #if defined(USE_LONG_DOUBLE)
6212             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"PERL_PRIgldbl"\n",
6213                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6214 #else
6215             DEBUG_c(PerlIO_printf(Perl_debug_log,"sv_dec punt failed to convert '%s' to IOK or NOKp, UV=0x%"UVxf" NV=%"NVgf"\n",
6216                                   SvPVX_const(sv), SvIVX(sv), SvNVX(sv)));
6217 #endif
6218         }
6219     }
6220 #endif /* PERL_PRESERVE_IVUV */
6221     sv_setnv(sv,Atof(SvPVX_const(sv)) - 1.0);   /* punt */
6222 }
6223
6224 /*
6225 =for apidoc sv_mortalcopy
6226
6227 Creates a new SV which is a copy of the original SV (using C<sv_setsv>).
6228 The new SV is marked as mortal. It will be destroyed "soon", either by an
6229 explicit call to FREETMPS, or by an implicit call at places such as
6230 statement boundaries.  See also C<sv_newmortal> and C<sv_2mortal>.
6231
6232 =cut
6233 */
6234
6235 /* Make a string that will exist for the duration of the expression
6236  * evaluation.  Actually, it may have to last longer than that, but
6237  * hopefully we won't free it until it has been assigned to a
6238  * permanent location. */
6239
6240 SV *
6241 Perl_sv_mortalcopy(pTHX_ SV *oldstr)
6242 {
6243     register SV *sv;
6244
6245     new_SV(sv);
6246     sv_setsv(sv,oldstr);
6247     EXTEND_MORTAL(1);
6248     PL_tmps_stack[++PL_tmps_ix] = sv;
6249     SvTEMP_on(sv);
6250     return sv;
6251 }
6252
6253 /*
6254 =for apidoc sv_newmortal
6255
6256 Creates a new null SV which is mortal.  The reference count of the SV is
6257 set to 1. It will be destroyed "soon", either by an explicit call to
6258 FREETMPS, or by an implicit call at places such as statement boundaries.
6259 See also C<sv_mortalcopy> and C<sv_2mortal>.
6260
6261 =cut
6262 */
6263
6264 SV *
6265 Perl_sv_newmortal(pTHX)
6266 {
6267     register SV *sv;
6268
6269     new_SV(sv);
6270     SvFLAGS(sv) = SVs_TEMP;
6271     EXTEND_MORTAL(1);
6272     PL_tmps_stack[++PL_tmps_ix] = sv;
6273     return sv;
6274 }
6275
6276 /*
6277 =for apidoc sv_2mortal
6278
6279 Marks an existing SV as mortal.  The SV will be destroyed "soon", either
6280 by an explicit call to FREETMPS, or by an implicit call at places such as
6281 statement boundaries.  SvTEMP() is turned on which means that the SV's
6282 string buffer can be "stolen" if this SV is copied. See also C<sv_newmortal>
6283 and C<sv_mortalcopy>.
6284
6285 =cut
6286 */
6287
6288 SV *
6289 Perl_sv_2mortal(pTHX_ register SV *sv)
6290 {
6291     dVAR;
6292     if (!sv)
6293         return sv;
6294     if (SvREADONLY(sv) && SvIMMORTAL(sv))
6295         return sv;
6296     EXTEND_MORTAL(1);
6297     PL_tmps_stack[++PL_tmps_ix] = sv;
6298     SvTEMP_on(sv);
6299     return sv;
6300 }
6301
6302 /*
6303 =for apidoc newSVpv
6304
6305 Creates a new SV and copies a string into it.  The reference count for the
6306 SV is set to 1.  If C<len> is zero, Perl will compute the length using
6307 strlen().  For efficiency, consider using C<newSVpvn> instead.
6308
6309 =cut
6310 */
6311
6312 SV *
6313 Perl_newSVpv(pTHX_ const char *s, STRLEN len)
6314 {
6315     register SV *sv;
6316
6317     new_SV(sv);
6318     sv_setpvn(sv,s,len ? len : strlen(s));
6319     return sv;
6320 }
6321
6322 /*
6323 =for apidoc newSVpvn
6324
6325 Creates a new SV and copies a string into it.  The reference count for the
6326 SV is set to 1.  Note that if C<len> is zero, Perl will create a zero length
6327 string.  You are responsible for ensuring that the source string is at least
6328 C<len> bytes long.  If the C<s> argument is NULL the new SV will be undefined.
6329
6330 =cut
6331 */
6332
6333 SV *
6334 Perl_newSVpvn(pTHX_ const char *s, STRLEN len)
6335 {
6336     register SV *sv;
6337
6338     new_SV(sv);
6339     sv_setpvn(sv,s,len);
6340     return sv;
6341 }
6342
6343
6344 /*
6345 =for apidoc newSVhek
6346
6347 Creates a new SV from the hash key structure.  It will generate scalars that
6348 point to the shared string table where possible. Returns a new (undefined)
6349 SV if the hek is NULL.
6350
6351 =cut
6352 */
6353
6354 SV *
6355 Perl_newSVhek(pTHX_ const HEK *hek)
6356 {
6357     if (!hek) {
6358         SV *sv;
6359
6360         new_SV(sv);
6361         return sv;
6362     }
6363
6364     if (HEK_LEN(hek) == HEf_SVKEY) {
6365         return newSVsv(*(SV**)HEK_KEY(hek));
6366     } else {
6367         const int flags = HEK_FLAGS(hek);
6368         if (flags & HVhek_WASUTF8) {
6369             /* Trouble :-)
6370                Andreas would like keys he put in as utf8 to come back as utf8
6371             */
6372             STRLEN utf8_len = HEK_LEN(hek);
6373             const U8 *as_utf8 = bytes_to_utf8 ((U8*)HEK_KEY(hek), &utf8_len);
6374             SV * const sv = newSVpvn ((const char*)as_utf8, utf8_len);
6375
6376             SvUTF8_on (sv);
6377             Safefree (as_utf8); /* bytes_to_utf8() allocates a new string */
6378             return sv;
6379         } else if (flags & HVhek_REHASH) {
6380             /* We don't have a pointer to the hv, so we have to replicate the
6381                flag into every HEK. This hv is using custom a hasing
6382                algorithm. Hence we can't return a shared string scalar, as
6383                that would contain the (wrong) hash value, and might get passed
6384                into an hv routine with a regular hash  */
6385
6386             SV * const sv = newSVpvn (HEK_KEY(hek), HEK_LEN(hek));
6387             if (HEK_UTF8(hek))
6388                 SvUTF8_on (sv);
6389             return sv;
6390         }
6391         /* This will be overwhelminly the most common case.  */
6392         return newSVpvn_share(HEK_KEY(hek),
6393                               (HEK_UTF8(hek) ? -HEK_LEN(hek) : HEK_LEN(hek)),
6394                               HEK_HASH(hek));
6395     }
6396 }
6397
6398 /*
6399 =for apidoc newSVpvn_share
6400
6401 Creates a new SV with its SvPVX_const pointing to a shared string in the string
6402 table. If the string does not already exist in the table, it is created
6403 first.  Turns on READONLY and FAKE.  The string's hash is stored in the UV
6404 slot of the SV; if the C<hash> parameter is non-zero, that value is used;
6405 otherwise the hash is computed.  The idea here is that as the string table
6406 is used for shared hash keys these strings will have SvPVX_const == HeKEY and
6407 hash lookup will avoid string compare.
6408
6409 =cut
6410 */
6411
6412 SV *
6413 Perl_newSVpvn_share(pTHX_ const char *src, I32 len, U32 hash)
6414 {
6415     register SV *sv;
6416     bool is_utf8 = FALSE;
6417     if (len < 0) {
6418         STRLEN tmplen = -len;
6419         is_utf8 = TRUE;
6420         /* See the note in hv.c:hv_fetch() --jhi */
6421         src = (char*)bytes_from_utf8((const U8*)src, &tmplen, &is_utf8);
6422         len = tmplen;
6423     }
6424     if (!hash)
6425         PERL_HASH(hash, src, len);
6426     new_SV(sv);
6427     sv_upgrade(sv, SVt_PV);
6428     SvPV_set(sv, sharepvn(src, is_utf8?-len:len, hash));
6429     SvCUR_set(sv, len);
6430     SvLEN_set(sv, 0);
6431     SvREADONLY_on(sv);
6432     SvFAKE_on(sv);
6433     SvPOK_on(sv);
6434     if (is_utf8)
6435         SvUTF8_on(sv);
6436     return sv;
6437 }
6438
6439
6440 #if defined(PERL_IMPLICIT_CONTEXT)
6441
6442 /* pTHX_ magic can't cope with varargs, so this is a no-context
6443  * version of the main function, (which may itself be aliased to us).
6444  * Don't access this version directly.
6445  */
6446
6447 SV *
6448 Perl_newSVpvf_nocontext(const char* pat, ...)
6449 {
6450     dTHX;
6451     register SV *sv;
6452     va_list args;
6453     va_start(args, pat);
6454     sv = vnewSVpvf(pat, &args);
6455     va_end(args);
6456     return sv;
6457 }
6458 #endif
6459
6460 /*
6461 =for apidoc newSVpvf
6462
6463 Creates a new SV and initializes it with the string formatted like
6464 C<sprintf>.
6465
6466 =cut
6467 */
6468
6469 SV *
6470 Perl_newSVpvf(pTHX_ const char* pat, ...)
6471 {
6472     register SV *sv;
6473     va_list args;
6474     va_start(args, pat);
6475     sv = vnewSVpvf(pat, &args);
6476     va_end(args);
6477     return sv;
6478 }
6479
6480 /* backend for newSVpvf() and newSVpvf_nocontext() */
6481
6482 SV *
6483 Perl_vnewSVpvf(pTHX_ const char* pat, va_list* args)
6484 {
6485     register SV *sv;
6486     new_SV(sv);
6487     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
6488     return sv;
6489 }
6490
6491 /*
6492 =for apidoc newSVnv
6493
6494 Creates a new SV and copies a floating point value into it.
6495 The reference count for the SV is set to 1.
6496
6497 =cut
6498 */
6499
6500 SV *
6501 Perl_newSVnv(pTHX_ NV n)
6502 {
6503     register SV *sv;
6504
6505     new_SV(sv);
6506     sv_setnv(sv,n);
6507     return sv;
6508 }
6509
6510 /*
6511 =for apidoc newSViv
6512
6513 Creates a new SV and copies an integer into it.  The reference count for the
6514 SV is set to 1.
6515
6516 =cut
6517 */
6518
6519 SV *
6520 Perl_newSViv(pTHX_ IV i)
6521 {
6522     register SV *sv;
6523
6524     new_SV(sv);
6525     sv_setiv(sv,i);
6526     return sv;
6527 }
6528
6529 /*
6530 =for apidoc newSVuv
6531
6532 Creates a new SV and copies an unsigned integer into it.
6533 The reference count for the SV is set to 1.
6534
6535 =cut
6536 */
6537
6538 SV *
6539 Perl_newSVuv(pTHX_ UV u)
6540 {
6541     register SV *sv;
6542
6543     new_SV(sv);
6544     sv_setuv(sv,u);
6545     return sv;
6546 }
6547
6548 /*
6549 =for apidoc newRV_noinc
6550
6551 Creates an RV wrapper for an SV.  The reference count for the original
6552 SV is B<not> incremented.
6553
6554 =cut
6555 */
6556
6557 SV *
6558 Perl_newRV_noinc(pTHX_ SV *tmpRef)
6559 {
6560     register SV *sv;
6561
6562     new_SV(sv);
6563     sv_upgrade(sv, SVt_RV);
6564     SvTEMP_off(tmpRef);
6565     SvRV_set(sv, tmpRef);
6566     SvROK_on(sv);
6567     return sv;
6568 }
6569
6570 /* newRV_inc is the official function name to use now.
6571  * newRV_inc is in fact #defined to newRV in sv.h
6572  */
6573
6574 SV *
6575 Perl_newRV(pTHX_ SV *tmpRef)
6576 {
6577     return newRV_noinc(SvREFCNT_inc(tmpRef));
6578 }
6579
6580 /*
6581 =for apidoc newSVsv
6582
6583 Creates a new SV which is an exact duplicate of the original SV.
6584 (Uses C<sv_setsv>).
6585
6586 =cut
6587 */
6588
6589 SV *
6590 Perl_newSVsv(pTHX_ register SV *old)
6591 {
6592     register SV *sv;
6593
6594     if (!old)
6595         return Nullsv;
6596     if (SvTYPE(old) == SVTYPEMASK) {
6597         if (ckWARN_d(WARN_INTERNAL))
6598             Perl_warner(aTHX_ packWARN(WARN_INTERNAL), "semi-panic: attempt to dup freed string");
6599         return Nullsv;
6600     }
6601     new_SV(sv);
6602     /* SV_GMAGIC is the default for sv_setv()
6603        SV_NOSTEAL prevents TEMP buffers being, well, stolen, and saves games
6604        with SvTEMP_off and SvTEMP_on round a call to sv_setsv.  */
6605     sv_setsv_flags(sv, old, SV_GMAGIC | SV_NOSTEAL);
6606     return sv;
6607 }
6608
6609 /*
6610 =for apidoc sv_reset
6611
6612 Underlying implementation for the C<reset> Perl function.
6613 Note that the perl-level function is vaguely deprecated.
6614
6615 =cut
6616 */
6617
6618 void
6619 Perl_sv_reset(pTHX_ register const char *s, HV *stash)
6620 {
6621     dVAR;
6622     char todo[PERL_UCHAR_MAX+1];
6623
6624     if (!stash)
6625         return;
6626
6627     if (!*s) {          /* reset ?? searches */
6628         MAGIC * const mg = mg_find((SV *)stash, PERL_MAGIC_symtab);
6629         if (mg) {
6630             PMOP *pm = (PMOP *) mg->mg_obj;
6631             while (pm) {
6632                 pm->op_pmdynflags &= ~PMdf_USED;
6633                 pm = pm->op_pmnext;
6634             }
6635         }
6636         return;
6637     }
6638
6639     /* reset variables */
6640
6641     if (!HvARRAY(stash))
6642         return;
6643
6644     Zero(todo, 256, char);
6645     while (*s) {
6646         I32 max;
6647         I32 i = (unsigned char)*s;
6648         if (s[1] == '-') {
6649             s += 2;
6650         }
6651         max = (unsigned char)*s++;
6652         for ( ; i <= max; i++) {
6653             todo[i] = 1;
6654         }
6655         for (i = 0; i <= (I32) HvMAX(stash); i++) {
6656             HE *entry;
6657             for (entry = HvARRAY(stash)[i];
6658                  entry;
6659                  entry = HeNEXT(entry))
6660             {
6661                 register GV *gv;
6662                 register SV *sv;
6663
6664                 if (!todo[(U8)*HeKEY(entry)])
6665                     continue;
6666                 gv = (GV*)HeVAL(entry);
6667                 sv = GvSV(gv);
6668                 if (sv) {
6669                     if (SvTHINKFIRST(sv)) {
6670                         if (!SvREADONLY(sv) && SvROK(sv))
6671                             sv_unref(sv);
6672                         /* XXX Is this continue a bug? Why should THINKFIRST
6673                            exempt us from resetting arrays and hashes?  */
6674                         continue;
6675                     }
6676                     SvOK_off(sv);
6677                     if (SvTYPE(sv) >= SVt_PV) {
6678                         SvCUR_set(sv, 0);
6679                         if (SvPVX_const(sv) != Nullch)
6680                             *SvPVX(sv) = '\0';
6681                         SvTAINT(sv);
6682                     }
6683                 }
6684                 if (GvAV(gv)) {
6685                     av_clear(GvAV(gv));
6686                 }
6687                 if (GvHV(gv) && !HvNAME_get(GvHV(gv))) {
6688 #if defined(VMS)
6689                     Perl_die(aTHX_ "Can't reset %%ENV on this system");
6690 #else /* ! VMS */
6691                     hv_clear(GvHV(gv));
6692 #  if defined(USE_ENVIRON_ARRAY)
6693                     if (gv == PL_envgv)
6694                         my_clearenv();
6695 #  endif /* USE_ENVIRON_ARRAY */
6696 #endif /* VMS */
6697                 }
6698             }
6699         }
6700     }
6701 }
6702
6703 /*
6704 =for apidoc sv_2io
6705
6706 Using various gambits, try to get an IO from an SV: the IO slot if its a
6707 GV; or the recursive result if we're an RV; or the IO slot of the symbol
6708 named after the PV if we're a string.
6709
6710 =cut
6711 */
6712
6713 IO*
6714 Perl_sv_2io(pTHX_ SV *sv)
6715 {
6716     IO* io;
6717     GV* gv;
6718
6719     switch (SvTYPE(sv)) {
6720     case SVt_PVIO:
6721         io = (IO*)sv;
6722         break;
6723     case SVt_PVGV:
6724         gv = (GV*)sv;
6725         io = GvIO(gv);
6726         if (!io)
6727             Perl_croak(aTHX_ "Bad filehandle: %s", GvNAME(gv));
6728         break;
6729     default:
6730         if (!SvOK(sv))
6731             Perl_croak(aTHX_ PL_no_usym, "filehandle");
6732         if (SvROK(sv))
6733             return sv_2io(SvRV(sv));
6734         gv = gv_fetchsv(sv, FALSE, SVt_PVIO);
6735         if (gv)
6736             io = GvIO(gv);
6737         else
6738             io = 0;
6739         if (!io)
6740             Perl_croak(aTHX_ "Bad filehandle: %"SVf, sv);
6741         break;
6742     }
6743     return io;
6744 }
6745
6746 /*
6747 =for apidoc sv_2cv
6748
6749 Using various gambits, try to get a CV from an SV; in addition, try if
6750 possible to set C<*st> and C<*gvp> to the stash and GV associated with it.
6751
6752 =cut
6753 */
6754
6755 CV *
6756 Perl_sv_2cv(pTHX_ SV *sv, HV **st, GV **gvp, I32 lref)
6757 {
6758     dVAR;
6759     GV *gv = Nullgv;
6760     CV *cv = Nullcv;
6761
6762     if (!sv)
6763         return *gvp = Nullgv, Nullcv;
6764     switch (SvTYPE(sv)) {
6765     case SVt_PVCV:
6766         *st = CvSTASH(sv);
6767         *gvp = Nullgv;
6768         return (CV*)sv;
6769     case SVt_PVHV:
6770     case SVt_PVAV:
6771         *gvp = Nullgv;
6772         return Nullcv;
6773     case SVt_PVGV:
6774         gv = (GV*)sv;
6775         *gvp = gv;
6776         *st = GvESTASH(gv);
6777         goto fix_gv;
6778
6779     default:
6780         SvGETMAGIC(sv);
6781         if (SvROK(sv)) {
6782             SV * const *sp = &sv;       /* Used in tryAMAGICunDEREF macro. */
6783             tryAMAGICunDEREF(to_cv);
6784
6785             sv = SvRV(sv);
6786             if (SvTYPE(sv) == SVt_PVCV) {
6787                 cv = (CV*)sv;
6788                 *gvp = Nullgv;
6789                 *st = CvSTASH(cv);
6790                 return cv;
6791             }
6792             else if(isGV(sv))
6793                 gv = (GV*)sv;
6794             else
6795                 Perl_croak(aTHX_ "Not a subroutine reference");
6796         }
6797         else if (isGV(sv))
6798             gv = (GV*)sv;
6799         else
6800             gv = gv_fetchsv(sv, lref, SVt_PVCV);
6801         *gvp = gv;
6802         if (!gv)
6803             return Nullcv;
6804         *st = GvESTASH(gv);
6805     fix_gv:
6806         if (lref && !GvCVu(gv)) {
6807             SV *tmpsv;
6808             ENTER;
6809             tmpsv = NEWSV(704,0);
6810             gv_efullname3(tmpsv, gv, Nullch);
6811             /* XXX this is probably not what they think they're getting.
6812              * It has the same effect as "sub name;", i.e. just a forward
6813              * declaration! */
6814             newSUB(start_subparse(FALSE, 0),
6815                    newSVOP(OP_CONST, 0, tmpsv),
6816                    Nullop,
6817                    Nullop);
6818             LEAVE;
6819             if (!GvCVu(gv))
6820                 Perl_croak(aTHX_ "Unable to create sub named \"%"SVf"\"",
6821                            sv);
6822         }
6823         return GvCVu(gv);
6824     }
6825 }
6826
6827 /*
6828 =for apidoc sv_true
6829
6830 Returns true if the SV has a true value by Perl's rules.
6831 Use the C<SvTRUE> macro instead, which may call C<sv_true()> or may
6832 instead use an in-line version.
6833
6834 =cut
6835 */
6836
6837 I32
6838 Perl_sv_true(pTHX_ register SV *sv)
6839 {
6840     if (!sv)
6841         return 0;
6842     if (SvPOK(sv)) {
6843         register const XPV* const tXpv = (XPV*)SvANY(sv);
6844         if (tXpv &&
6845                 (tXpv->xpv_cur > 1 ||
6846                 (tXpv->xpv_cur && *sv->sv_u.svu_pv != '0')))
6847             return 1;
6848         else
6849             return 0;
6850     }
6851     else {
6852         if (SvIOK(sv))
6853             return SvIVX(sv) != 0;
6854         else {
6855             if (SvNOK(sv))
6856                 return SvNVX(sv) != 0.0;
6857             else
6858                 return sv_2bool(sv);
6859         }
6860     }
6861 }
6862
6863 /*
6864 =for apidoc sv_pvn_force
6865
6866 Get a sensible string out of the SV somehow.
6867 A private implementation of the C<SvPV_force> macro for compilers which
6868 can't cope with complex macro expressions. Always use the macro instead.
6869
6870 =for apidoc sv_pvn_force_flags
6871
6872 Get a sensible string out of the SV somehow.
6873 If C<flags> has C<SV_GMAGIC> bit set, will C<mg_get> on C<sv> if
6874 appropriate, else not. C<sv_pvn_force> and C<sv_pvn_force_nomg> are
6875 implemented in terms of this function.
6876 You normally want to use the various wrapper macros instead: see
6877 C<SvPV_force> and C<SvPV_force_nomg>
6878
6879 =cut
6880 */
6881
6882 char *
6883 Perl_sv_pvn_force_flags(pTHX_ SV *sv, STRLEN *lp, I32 flags)
6884 {
6885
6886     if (SvTHINKFIRST(sv) && !SvROK(sv))
6887         sv_force_normal_flags(sv, 0);
6888
6889     if (SvPOK(sv)) {
6890         if (lp)
6891             *lp = SvCUR(sv);
6892     }
6893     else {
6894         char *s;
6895         STRLEN len;
6896  
6897         if (SvREADONLY(sv) && !(flags & SV_MUTABLE_RETURN)) {
6898             const char * const ref = sv_reftype(sv,0);
6899             if (PL_op)
6900                 Perl_croak(aTHX_ "Can't coerce readonly %s to string in %s",
6901                            ref, OP_NAME(PL_op));
6902             else
6903                 Perl_croak(aTHX_ "Can't coerce readonly %s to string", ref);
6904         }
6905         if (SvTYPE(sv) > SVt_PVLV && SvTYPE(sv) != SVt_PVFM)
6906             Perl_croak(aTHX_ "Can't coerce %s to string in %s", sv_reftype(sv,0),
6907                 OP_NAME(PL_op));
6908         s = sv_2pv_flags(sv, &len, flags);
6909         if (lp)
6910             *lp = len;
6911
6912         if (s != SvPVX_const(sv)) {     /* Almost, but not quite, sv_setpvn() */
6913             if (SvROK(sv))
6914                 sv_unref(sv);
6915             SvUPGRADE(sv, SVt_PV);              /* Never FALSE */
6916             SvGROW(sv, len + 1);
6917             Move(s,SvPVX(sv),len,char);
6918             SvCUR_set(sv, len);
6919             *SvEND(sv) = '\0';
6920         }
6921         if (!SvPOK(sv)) {
6922             SvPOK_on(sv);               /* validate pointer */
6923             SvTAINT(sv);
6924             DEBUG_c(PerlIO_printf(Perl_debug_log, "0x%"UVxf" 2pv(%s)\n",
6925                                   PTR2UV(sv),SvPVX_const(sv)));
6926         }
6927     }
6928     return SvPVX_mutable(sv);
6929 }
6930
6931 /*
6932 =for apidoc sv_pvbyten_force
6933
6934 The backend for the C<SvPVbytex_force> macro. Always use the macro instead.
6935
6936 =cut
6937 */
6938
6939 char *
6940 Perl_sv_pvbyten_force(pTHX_ SV *sv, STRLEN *lp)
6941 {
6942     sv_pvn_force(sv,lp);
6943     sv_utf8_downgrade(sv,0);
6944     *lp = SvCUR(sv);
6945     return SvPVX(sv);
6946 }
6947
6948 /*
6949 =for apidoc sv_pvutf8n_force
6950
6951 The backend for the C<SvPVutf8x_force> macro. Always use the macro instead.
6952
6953 =cut
6954 */
6955
6956 char *
6957 Perl_sv_pvutf8n_force(pTHX_ SV *sv, STRLEN *lp)
6958 {
6959     sv_pvn_force(sv,lp);
6960     sv_utf8_upgrade(sv);
6961     *lp = SvCUR(sv);
6962     return SvPVX(sv);
6963 }
6964
6965 /*
6966 =for apidoc sv_reftype
6967
6968 Returns a string describing what the SV is a reference to.
6969
6970 =cut
6971 */
6972
6973 char *
6974 Perl_sv_reftype(pTHX_ const SV *sv, int ob)
6975 {
6976     /* The fact that I don't need to downcast to char * everywhere, only in ?:
6977        inside return suggests a const propagation bug in g++.  */
6978     if (ob && SvOBJECT(sv)) {
6979         char * const name = HvNAME_get(SvSTASH(sv));
6980         return name ? name : (char *) "__ANON__";
6981     }
6982     else {
6983         switch (SvTYPE(sv)) {
6984         case SVt_NULL:
6985         case SVt_IV:
6986         case SVt_NV:
6987         case SVt_RV:
6988         case SVt_PV:
6989         case SVt_PVIV:
6990         case SVt_PVNV:
6991         case SVt_PVMG:
6992         case SVt_PVBM:
6993                                 if (SvVOK(sv))
6994                                     return "VSTRING";
6995                                 if (SvROK(sv))
6996                                     return "REF";
6997                                 else
6998                                     return "SCALAR";
6999
7000         case SVt_PVLV:          return (char *)  (SvROK(sv) ? "REF"
7001                                 /* tied lvalues should appear to be
7002                                  * scalars for backwards compatitbility */
7003                                 : (LvTYPE(sv) == 't' || LvTYPE(sv) == 'T')
7004                                     ? "SCALAR" : "LVALUE");
7005         case SVt_PVAV:          return "ARRAY";
7006         case SVt_PVHV:          return "HASH";
7007         case SVt_PVCV:          return "CODE";
7008         case SVt_PVGV:          return "GLOB";
7009         case SVt_PVFM:          return "FORMAT";
7010         case SVt_PVIO:          return "IO";
7011         default:                return "UNKNOWN";
7012         }
7013     }
7014 }
7015
7016 /*
7017 =for apidoc sv_isobject
7018
7019 Returns a boolean indicating whether the SV is an RV pointing to a blessed
7020 object.  If the SV is not an RV, or if the object is not blessed, then this
7021 will return false.
7022
7023 =cut
7024 */
7025
7026 int
7027 Perl_sv_isobject(pTHX_ SV *sv)
7028 {
7029     if (!sv)
7030         return 0;
7031     SvGETMAGIC(sv);
7032     if (!SvROK(sv))
7033         return 0;
7034     sv = (SV*)SvRV(sv);
7035     if (!SvOBJECT(sv))
7036         return 0;
7037     return 1;
7038 }
7039
7040 /*
7041 =for apidoc sv_isa
7042
7043 Returns a boolean indicating whether the SV is blessed into the specified
7044 class.  This does not check for subtypes; use C<sv_derived_from> to verify
7045 an inheritance relationship.
7046
7047 =cut
7048 */
7049
7050 int
7051 Perl_sv_isa(pTHX_ SV *sv, const char *name)
7052 {
7053     const char *hvname;
7054     if (!sv)
7055         return 0;
7056     SvGETMAGIC(sv);
7057     if (!SvROK(sv))
7058         return 0;
7059     sv = (SV*)SvRV(sv);
7060     if (!SvOBJECT(sv))
7061         return 0;
7062     hvname = HvNAME_get(SvSTASH(sv));
7063     if (!hvname)
7064         return 0;
7065
7066     return strEQ(hvname, name);
7067 }
7068
7069 /*
7070 =for apidoc newSVrv
7071
7072 Creates a new SV for the RV, C<rv>, to point to.  If C<rv> is not an RV then
7073 it will be upgraded to one.  If C<classname> is non-null then the new SV will
7074 be blessed in the specified package.  The new SV is returned and its
7075 reference count is 1.
7076
7077 =cut
7078 */
7079
7080 SV*
7081 Perl_newSVrv(pTHX_ SV *rv, const char *classname)
7082 {
7083     SV *sv;
7084
7085     new_SV(sv);
7086
7087     SV_CHECK_THINKFIRST_COW_DROP(rv);
7088     SvAMAGIC_off(rv);
7089
7090     if (SvTYPE(rv) >= SVt_PVMG) {
7091         const U32 refcnt = SvREFCNT(rv);
7092         SvREFCNT(rv) = 0;
7093         sv_clear(rv);
7094         SvFLAGS(rv) = 0;
7095         SvREFCNT(rv) = refcnt;
7096     }
7097
7098     if (SvTYPE(rv) < SVt_RV)
7099         sv_upgrade(rv, SVt_RV);
7100     else if (SvTYPE(rv) > SVt_RV) {
7101         SvPV_free(rv);
7102         SvCUR_set(rv, 0);
7103         SvLEN_set(rv, 0);
7104     }
7105
7106     SvOK_off(rv);
7107     SvRV_set(rv, sv);
7108     SvROK_on(rv);
7109
7110     if (classname) {
7111         HV* const stash = gv_stashpv(classname, TRUE);
7112         (void)sv_bless(rv, stash);
7113     }
7114     return sv;
7115 }
7116
7117 /*
7118 =for apidoc sv_setref_pv
7119
7120 Copies a pointer into a new SV, optionally blessing the SV.  The C<rv>
7121 argument will be upgraded to an RV.  That RV will be modified to point to
7122 the new SV.  If the C<pv> argument is NULL then C<PL_sv_undef> will be placed
7123 into the SV.  The C<classname> argument indicates the package for the
7124 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7125 will have a reference count of 1, and the RV will be returned.
7126
7127 Do not use with other Perl types such as HV, AV, SV, CV, because those
7128 objects will become corrupted by the pointer copy process.
7129
7130 Note that C<sv_setref_pvn> copies the string while this copies the pointer.
7131
7132 =cut
7133 */
7134
7135 SV*
7136 Perl_sv_setref_pv(pTHX_ SV *rv, const char *classname, void *pv)
7137 {
7138     if (!pv) {
7139         sv_setsv(rv, &PL_sv_undef);
7140         SvSETMAGIC(rv);
7141     }
7142     else
7143         sv_setiv(newSVrv(rv,classname), PTR2IV(pv));
7144     return rv;
7145 }
7146
7147 /*
7148 =for apidoc sv_setref_iv
7149
7150 Copies an integer into a new SV, optionally blessing the SV.  The C<rv>
7151 argument will be upgraded to an RV.  That RV will be modified to point to
7152 the new SV.  The C<classname> argument indicates the package for the
7153 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7154 will have a reference count of 1, and the RV will be returned.
7155
7156 =cut
7157 */
7158
7159 SV*
7160 Perl_sv_setref_iv(pTHX_ SV *rv, const char *classname, IV iv)
7161 {
7162     sv_setiv(newSVrv(rv,classname), iv);
7163     return rv;
7164 }
7165
7166 /*
7167 =for apidoc sv_setref_uv
7168
7169 Copies an unsigned integer into a new SV, optionally blessing the SV.  The C<rv>
7170 argument will be upgraded to an RV.  That RV will be modified to point to
7171 the new SV.  The C<classname> argument indicates the package for the
7172 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7173 will have a reference count of 1, and the RV will be returned.
7174
7175 =cut
7176 */
7177
7178 SV*
7179 Perl_sv_setref_uv(pTHX_ SV *rv, const char *classname, UV uv)
7180 {
7181     sv_setuv(newSVrv(rv,classname), uv);
7182     return rv;
7183 }
7184
7185 /*
7186 =for apidoc sv_setref_nv
7187
7188 Copies a double into a new SV, optionally blessing the SV.  The C<rv>
7189 argument will be upgraded to an RV.  That RV will be modified to point to
7190 the new SV.  The C<classname> argument indicates the package for the
7191 blessing.  Set C<classname> to C<Nullch> to avoid the blessing.  The new SV
7192 will have a reference count of 1, and the RV will be returned.
7193
7194 =cut
7195 */
7196
7197 SV*
7198 Perl_sv_setref_nv(pTHX_ SV *rv, const char *classname, NV nv)
7199 {
7200     sv_setnv(newSVrv(rv,classname), nv);
7201     return rv;
7202 }
7203
7204 /*
7205 =for apidoc sv_setref_pvn
7206
7207 Copies a string into a new SV, optionally blessing the SV.  The length of the
7208 string must be specified with C<n>.  The C<rv> argument will be upgraded to
7209 an RV.  That RV will be modified to point to the new SV.  The C<classname>
7210 argument indicates the package for the blessing.  Set C<classname> to
7211 C<Nullch> to avoid the blessing.  The new SV will have a reference count
7212 of 1, and the RV will be returned.
7213
7214 Note that C<sv_setref_pv> copies the pointer while this copies the string.
7215
7216 =cut
7217 */
7218
7219 SV*
7220 Perl_sv_setref_pvn(pTHX_ SV *rv, const char *classname, const char *pv, STRLEN n)
7221 {
7222     sv_setpvn(newSVrv(rv,classname), pv, n);
7223     return rv;
7224 }
7225
7226 /*
7227 =for apidoc sv_bless
7228
7229 Blesses an SV into a specified package.  The SV must be an RV.  The package
7230 must be designated by its stash (see C<gv_stashpv()>).  The reference count
7231 of the SV is unaffected.
7232
7233 =cut
7234 */
7235
7236 SV*
7237 Perl_sv_bless(pTHX_ SV *sv, HV *stash)
7238 {
7239     SV *tmpRef;
7240     if (!SvROK(sv))
7241         Perl_croak(aTHX_ "Can't bless non-reference value");
7242     tmpRef = SvRV(sv);
7243     if (SvFLAGS(tmpRef) & (SVs_OBJECT|SVf_READONLY)) {
7244         if (SvREADONLY(tmpRef))
7245             Perl_croak(aTHX_ PL_no_modify);
7246         if (SvOBJECT(tmpRef)) {
7247             if (SvTYPE(tmpRef) != SVt_PVIO)
7248                 --PL_sv_objcount;
7249             SvREFCNT_dec(SvSTASH(tmpRef));
7250         }
7251     }
7252     SvOBJECT_on(tmpRef);
7253     if (SvTYPE(tmpRef) != SVt_PVIO)
7254         ++PL_sv_objcount;
7255     SvUPGRADE(tmpRef, SVt_PVMG);
7256     SvSTASH_set(tmpRef, (HV*)SvREFCNT_inc(stash));
7257
7258     if (Gv_AMG(stash))
7259         SvAMAGIC_on(sv);
7260     else
7261         SvAMAGIC_off(sv);
7262
7263     if(SvSMAGICAL(tmpRef))
7264         if(mg_find(tmpRef, PERL_MAGIC_ext) || mg_find(tmpRef, PERL_MAGIC_uvar))
7265             mg_set(tmpRef);
7266
7267
7268
7269     return sv;
7270 }
7271
7272 /* Downgrades a PVGV to a PVMG.
7273  */
7274
7275 STATIC void
7276 S_sv_unglob(pTHX_ SV *sv)
7277 {
7278     void *xpvmg;
7279
7280     assert(SvTYPE(sv) == SVt_PVGV);
7281     SvFAKE_off(sv);
7282     if (GvGP(sv))
7283         gp_free((GV*)sv);
7284     if (GvSTASH(sv)) {
7285         sv_del_backref((SV*)GvSTASH(sv), sv);
7286         GvSTASH(sv) = Nullhv;
7287     }
7288     sv_unmagic(sv, PERL_MAGIC_glob);
7289     Safefree(GvNAME(sv));
7290     GvMULTI_off(sv);
7291
7292     /* need to keep SvANY(sv) in the right arena */
7293     xpvmg = new_XPVMG();
7294     StructCopy(SvANY(sv), xpvmg, XPVMG);
7295     del_XPVGV(SvANY(sv));
7296     SvANY(sv) = xpvmg;
7297
7298     SvFLAGS(sv) &= ~SVTYPEMASK;
7299     SvFLAGS(sv) |= SVt_PVMG;
7300 }
7301
7302 /*
7303 =for apidoc sv_unref_flags
7304
7305 Unsets the RV status of the SV, and decrements the reference count of
7306 whatever was being referenced by the RV.  This can almost be thought of
7307 as a reversal of C<newSVrv>.  The C<cflags> argument can contain
7308 C<SV_IMMEDIATE_UNREF> to force the reference count to be decremented
7309 (otherwise the decrementing is conditional on the reference count being
7310 different from one or the reference being a readonly SV).
7311 See C<SvROK_off>.
7312
7313 =cut
7314 */
7315
7316 void
7317 Perl_sv_unref_flags(pTHX_ SV *ref, U32 flags)
7318 {
7319     SV* const target = SvRV(ref);
7320
7321     if (SvWEAKREF(ref)) {
7322         sv_del_backref(target, ref);
7323         SvWEAKREF_off(ref);
7324         SvRV_set(ref, NULL);
7325         return;
7326     }
7327     SvRV_set(ref, NULL);
7328     SvROK_off(ref);
7329     /* You can't have a || SvREADONLY(target) here, as $a = $$a, where $a was
7330        assigned to as BEGIN {$a = \"Foo"} will fail.  */
7331     if (SvREFCNT(target) != 1 || (flags & SV_IMMEDIATE_UNREF))
7332         SvREFCNT_dec(target);
7333     else /* XXX Hack, but hard to make $a=$a->[1] work otherwise */
7334         sv_2mortal(target);     /* Schedule for freeing later */
7335 }
7336
7337 /*
7338 =for apidoc sv_untaint
7339
7340 Untaint an SV. Use C<SvTAINTED_off> instead.
7341 =cut
7342 */
7343
7344 void
7345 Perl_sv_untaint(pTHX_ SV *sv)
7346 {
7347     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7348         MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7349         if (mg)
7350             mg->mg_len &= ~1;
7351     }
7352 }
7353
7354 /*
7355 =for apidoc sv_tainted
7356
7357 Test an SV for taintedness. Use C<SvTAINTED> instead.
7358 =cut
7359 */
7360
7361 bool
7362 Perl_sv_tainted(pTHX_ SV *sv)
7363 {
7364     if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
7365         const MAGIC * const mg = mg_find(sv, PERL_MAGIC_taint);
7366         if (mg && (mg->mg_len & 1) )
7367             return TRUE;
7368     }
7369     return FALSE;
7370 }
7371
7372 /*
7373 =for apidoc sv_setpviv
7374
7375 Copies an integer into the given SV, also updating its string value.
7376 Does not handle 'set' magic.  See C<sv_setpviv_mg>.
7377
7378 =cut
7379 */
7380
7381 void
7382 Perl_sv_setpviv(pTHX_ SV *sv, IV iv)
7383 {
7384     char buf[TYPE_CHARS(UV)];
7385     char *ebuf;
7386     char * const ptr = uiv_2buf(buf, iv, 0, 0, &ebuf);
7387
7388     sv_setpvn(sv, ptr, ebuf - ptr);
7389 }
7390
7391 /*
7392 =for apidoc sv_setpviv_mg
7393
7394 Like C<sv_setpviv>, but also handles 'set' magic.
7395
7396 =cut
7397 */
7398
7399 void
7400 Perl_sv_setpviv_mg(pTHX_ SV *sv, IV iv)
7401 {
7402     sv_setpviv(sv, iv);
7403     SvSETMAGIC(sv);
7404 }
7405
7406 #if defined(PERL_IMPLICIT_CONTEXT)
7407
7408 /* pTHX_ magic can't cope with varargs, so this is a no-context
7409  * version of the main function, (which may itself be aliased to us).
7410  * Don't access this version directly.
7411  */
7412
7413 void
7414 Perl_sv_setpvf_nocontext(SV *sv, const char* pat, ...)
7415 {
7416     dTHX;
7417     va_list args;
7418     va_start(args, pat);
7419     sv_vsetpvf(sv, pat, &args);
7420     va_end(args);
7421 }
7422
7423 /* pTHX_ magic can't cope with varargs, so this is a no-context
7424  * version of the main function, (which may itself be aliased to us).
7425  * Don't access this version directly.
7426  */
7427
7428 void
7429 Perl_sv_setpvf_mg_nocontext(SV *sv, const char* pat, ...)
7430 {
7431     dTHX;
7432     va_list args;
7433     va_start(args, pat);
7434     sv_vsetpvf_mg(sv, pat, &args);
7435     va_end(args);
7436 }
7437 #endif
7438
7439 /*
7440 =for apidoc sv_setpvf
7441
7442 Works like C<sv_catpvf> but copies the text into the SV instead of
7443 appending it.  Does not handle 'set' magic.  See C<sv_setpvf_mg>.
7444
7445 =cut
7446 */
7447
7448 void
7449 Perl_sv_setpvf(pTHX_ SV *sv, const char* pat, ...)
7450 {
7451     va_list args;
7452     va_start(args, pat);
7453     sv_vsetpvf(sv, pat, &args);
7454     va_end(args);
7455 }
7456
7457 /*
7458 =for apidoc sv_vsetpvf
7459
7460 Works like C<sv_vcatpvf> but copies the text into the SV instead of
7461 appending it.  Does not handle 'set' magic.  See C<sv_vsetpvf_mg>.
7462
7463 Usually used via its frontend C<sv_setpvf>.
7464
7465 =cut
7466 */
7467
7468 void
7469 Perl_sv_vsetpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7470 {
7471     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7472 }
7473
7474 /*
7475 =for apidoc sv_setpvf_mg
7476
7477 Like C<sv_setpvf>, but also handles 'set' magic.
7478
7479 =cut
7480 */
7481
7482 void
7483 Perl_sv_setpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7484 {
7485     va_list args;
7486     va_start(args, pat);
7487     sv_vsetpvf_mg(sv, pat, &args);
7488     va_end(args);
7489 }
7490
7491 /*
7492 =for apidoc sv_vsetpvf_mg
7493
7494 Like C<sv_vsetpvf>, but also handles 'set' magic.
7495
7496 Usually used via its frontend C<sv_setpvf_mg>.
7497
7498 =cut
7499 */
7500
7501 void
7502 Perl_sv_vsetpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7503 {
7504     sv_vsetpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7505     SvSETMAGIC(sv);
7506 }
7507
7508 #if defined(PERL_IMPLICIT_CONTEXT)
7509
7510 /* pTHX_ magic can't cope with varargs, so this is a no-context
7511  * version of the main function, (which may itself be aliased to us).
7512  * Don't access this version directly.
7513  */
7514
7515 void
7516 Perl_sv_catpvf_nocontext(SV *sv, const char* pat, ...)
7517 {
7518     dTHX;
7519     va_list args;
7520     va_start(args, pat);
7521     sv_vcatpvf(sv, pat, &args);
7522     va_end(args);
7523 }
7524
7525 /* pTHX_ magic can't cope with varargs, so this is a no-context
7526  * version of the main function, (which may itself be aliased to us).
7527  * Don't access this version directly.
7528  */
7529
7530 void
7531 Perl_sv_catpvf_mg_nocontext(SV *sv, const char* pat, ...)
7532 {
7533     dTHX;
7534     va_list args;
7535     va_start(args, pat);
7536     sv_vcatpvf_mg(sv, pat, &args);
7537     va_end(args);
7538 }
7539 #endif
7540
7541 /*
7542 =for apidoc sv_catpvf
7543
7544 Processes its arguments like C<sprintf> and appends the formatted
7545 output to an SV.  If the appended data contains "wide" characters
7546 (including, but not limited to, SVs with a UTF-8 PV formatted with %s,
7547 and characters >255 formatted with %c), the original SV might get
7548 upgraded to UTF-8.  Handles 'get' magic, but not 'set' magic.  See
7549 C<sv_catpvf_mg>. If the original SV was UTF-8, the pattern should be
7550 valid UTF-8; if the original SV was bytes, the pattern should be too.
7551
7552 =cut */
7553
7554 void
7555 Perl_sv_catpvf(pTHX_ SV *sv, const char* pat, ...)
7556 {
7557     va_list args;
7558     va_start(args, pat);
7559     sv_vcatpvf(sv, pat, &args);
7560     va_end(args);
7561 }
7562
7563 /*
7564 =for apidoc sv_vcatpvf
7565
7566 Processes its arguments like C<vsprintf> and appends the formatted output
7567 to an SV.  Does not handle 'set' magic.  See C<sv_vcatpvf_mg>.
7568
7569 Usually used via its frontend C<sv_catpvf>.
7570
7571 =cut
7572 */
7573
7574 void
7575 Perl_sv_vcatpvf(pTHX_ SV *sv, const char* pat, va_list* args)
7576 {
7577     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7578 }
7579
7580 /*
7581 =for apidoc sv_catpvf_mg
7582
7583 Like C<sv_catpvf>, but also handles 'set' magic.
7584
7585 =cut
7586 */
7587
7588 void
7589 Perl_sv_catpvf_mg(pTHX_ SV *sv, const char* pat, ...)
7590 {
7591     va_list args;
7592     va_start(args, pat);
7593     sv_vcatpvf_mg(sv, pat, &args);
7594     va_end(args);
7595 }
7596
7597 /*
7598 =for apidoc sv_vcatpvf_mg
7599
7600 Like C<sv_vcatpvf>, but also handles 'set' magic.
7601
7602 Usually used via its frontend C<sv_catpvf_mg>.
7603
7604 =cut
7605 */
7606
7607 void
7608 Perl_sv_vcatpvf_mg(pTHX_ SV *sv, const char* pat, va_list* args)
7609 {
7610     sv_vcatpvfn(sv, pat, strlen(pat), args, Null(SV**), 0, Null(bool*));
7611     SvSETMAGIC(sv);
7612 }
7613
7614 /*
7615 =for apidoc sv_vsetpvfn
7616
7617 Works like C<sv_vcatpvfn> but copies the text into the SV instead of
7618 appending it.
7619
7620 Usually used via one of its frontends C<sv_vsetpvf> and C<sv_vsetpvf_mg>.
7621
7622 =cut
7623 */
7624
7625 void
7626 Perl_sv_vsetpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7627 {
7628     sv_setpvn(sv, "", 0);
7629     sv_vcatpvfn(sv, pat, patlen, args, svargs, svmax, maybe_tainted);
7630 }
7631
7632 /* private function for use in sv_vcatpvfn via the EXPECT_NUMBER macro */
7633
7634 STATIC I32
7635 S_expect_number(pTHX_ char** pattern)
7636 {
7637     I32 var = 0;
7638     switch (**pattern) {
7639     case '1': case '2': case '3':
7640     case '4': case '5': case '6':
7641     case '7': case '8': case '9':
7642         while (isDIGIT(**pattern))
7643             var = var * 10 + (*(*pattern)++ - '0');
7644     }
7645     return var;
7646 }
7647 #define EXPECT_NUMBER(pattern, var) (var = S_expect_number(aTHX_ &pattern))
7648
7649 static char *
7650 F0convert(NV nv, char *endbuf, STRLEN *len)
7651 {
7652     const int neg = nv < 0;
7653     UV uv;
7654
7655     if (neg)
7656         nv = -nv;
7657     if (nv < UV_MAX) {
7658         char *p = endbuf;
7659         nv += 0.5;
7660         uv = (UV)nv;
7661         if (uv & 1 && uv == nv)
7662             uv--;                       /* Round to even */
7663         do {
7664             const unsigned dig = uv % 10;
7665             *--p = '0' + dig;
7666         } while (uv /= 10);
7667         if (neg)
7668             *--p = '-';
7669         *len = endbuf - p;
7670         return p;
7671     }
7672     return Nullch;
7673 }
7674
7675
7676 /*
7677 =for apidoc sv_vcatpvfn
7678
7679 Processes its arguments like C<vsprintf> and appends the formatted output
7680 to an SV.  Uses an array of SVs if the C style variable argument list is
7681 missing (NULL).  When running with taint checks enabled, indicates via
7682 C<maybe_tainted> if results are untrustworthy (often due to the use of
7683 locales).
7684
7685 Usually used via one of its frontends C<sv_vcatpvf> and C<sv_vcatpvf_mg>.
7686
7687 =cut
7688 */
7689
7690
7691 #define VECTORIZE_ARGS  vecsv = va_arg(*args, SV*);\
7692                         vecstr = (U8*)SvPV_const(vecsv,veclen);\
7693                         vec_utf8 = DO_UTF8(vecsv);
7694
7695 /* XXX maybe_tainted is never assigned to, so the doc above is lying. */
7696
7697 void
7698 Perl_sv_vcatpvfn(pTHX_ SV *sv, const char *pat, STRLEN patlen, va_list *args, SV **svargs, I32 svmax, bool *maybe_tainted)
7699 {
7700     char *p;
7701     char *q;
7702     const char *patend;
7703     STRLEN origlen;
7704     I32 svix = 0;
7705     static const char nullstr[] = "(null)";
7706     SV *argsv = Nullsv;
7707     bool has_utf8 = DO_UTF8(sv);    /* has the result utf8? */
7708     const bool pat_utf8 = has_utf8; /* the pattern is in utf8? */
7709     SV *nsv = Nullsv;
7710     /* Times 4: a decimal digit takes more than 3 binary digits.
7711      * NV_DIG: mantissa takes than many decimal digits.
7712      * Plus 32: Playing safe. */
7713     char ebuf[IV_DIG * 4 + NV_DIG + 32];
7714     /* large enough for "%#.#f" --chip */
7715     /* what about long double NVs? --jhi */
7716
7717     PERL_UNUSED_ARG(maybe_tainted);
7718
7719     /* no matter what, this is a string now */
7720     (void)SvPV_force(sv, origlen);
7721
7722     /* special-case "", "%s", and "%-p" (SVf - see below) */
7723     if (patlen == 0)
7724         return;
7725     if (patlen == 2 && pat[0] == '%' && pat[1] == 's') {
7726         if (args) {
7727             const char * const s = va_arg(*args, char*);
7728             sv_catpv(sv, s ? s : nullstr);
7729         }
7730         else if (svix < svmax) {
7731             sv_catsv(sv, *svargs);
7732         }
7733         return;
7734     }
7735     if (args && patlen == 3 && pat[0] == '%' &&
7736                 pat[1] == '-' && pat[2] == 'p') {
7737         argsv = va_arg(*args, SV*);
7738         sv_catsv(sv, argsv);
7739         return;
7740     }
7741
7742 #ifndef USE_LONG_DOUBLE
7743     /* special-case "%.<number>[gf]" */
7744     if ( !args && patlen <= 5 && pat[0] == '%' && pat[1] == '.'
7745          && (pat[patlen-1] == 'g' || pat[patlen-1] == 'f') ) {
7746         unsigned digits = 0;
7747         const char *pp;
7748
7749         pp = pat + 2;
7750         while (*pp >= '0' && *pp <= '9')
7751             digits = 10 * digits + (*pp++ - '0');
7752         if (pp - pat == (int)patlen - 1) {
7753             NV nv;
7754
7755             if (svix < svmax)
7756                 nv = SvNV(*svargs);
7757             else
7758                 return;
7759             if (*pp == 'g') {
7760                 /* Add check for digits != 0 because it seems that some
7761                    gconverts are buggy in this case, and we don't yet have
7762                    a Configure test for this.  */
7763                 if (digits && digits < sizeof(ebuf) - NV_DIG - 10) {
7764                      /* 0, point, slack */
7765                     Gconvert(nv, (int)digits, 0, ebuf);
7766                     sv_catpv(sv, ebuf);
7767                     if (*ebuf)  /* May return an empty string for digits==0 */
7768                         return;
7769                 }
7770             } else if (!digits) {
7771                 STRLEN l;
7772
7773                 if ((p = F0convert(nv, ebuf + sizeof ebuf, &l))) {
7774                     sv_catpvn(sv, p, l);
7775                     return;
7776                 }
7777             }
7778         }
7779     }
7780 #endif /* !USE_LONG_DOUBLE */
7781
7782     if (!args && svix < svmax && DO_UTF8(*svargs))
7783         has_utf8 = TRUE;
7784
7785     patend = (char*)pat + patlen;
7786     for (p = (char*)pat; p < patend; p = q) {
7787         bool alt = FALSE;
7788         bool left = FALSE;
7789         bool vectorize = FALSE;
7790         bool vectorarg = FALSE;
7791         bool vec_utf8 = FALSE;
7792         char fill = ' ';
7793         char plus = 0;
7794         char intsize = 0;
7795         STRLEN width = 0;
7796         STRLEN zeros = 0;
7797         bool has_precis = FALSE;
7798         STRLEN precis = 0;
7799         I32 osvix = svix;
7800         bool is_utf8 = FALSE;  /* is this item utf8?   */
7801 #ifdef HAS_LDBL_SPRINTF_BUG
7802         /* This is to try to fix a bug with irix/nonstop-ux/powerux and
7803            with sfio - Allen <allens@cpan.org> */
7804         bool fix_ldbl_sprintf_bug = FALSE;
7805 #endif
7806
7807         char esignbuf[4];
7808         U8 utf8buf[UTF8_MAXBYTES+1];
7809         STRLEN esignlen = 0;
7810
7811         const char *eptr = Nullch;
7812         STRLEN elen = 0;
7813         SV *vecsv = Nullsv;
7814         const U8 *vecstr = Null(U8*);
7815         STRLEN veclen = 0;
7816         char c = 0;
7817         int i;
7818         unsigned base = 0;
7819         IV iv = 0;
7820         UV uv = 0;
7821         /* we need a long double target in case HAS_LONG_DOUBLE but
7822            not USE_LONG_DOUBLE
7823         */
7824 #if defined(HAS_LONG_DOUBLE) && LONG_DOUBLESIZE > DOUBLESIZE
7825         long double nv;
7826 #else
7827         NV nv;
7828 #endif
7829         STRLEN have;
7830         STRLEN need;
7831         STRLEN gap;
7832         const char *dotstr = ".";
7833         STRLEN dotstrlen = 1;
7834         I32 efix = 0; /* explicit format parameter index */
7835         I32 ewix = 0; /* explicit width index */
7836         I32 epix = 0; /* explicit precision index */
7837         I32 evix = 0; /* explicit vector index */
7838         bool asterisk = FALSE;
7839
7840         /* echo everything up to the next format specification */
7841         for (q = p; q < patend && *q != '%'; ++q) ;
7842         if (q > p) {
7843             if (has_utf8 && !pat_utf8)
7844                 sv_catpvn_utf8_upgrade(sv, p, q - p, nsv);
7845             else
7846                 sv_catpvn(sv, p, q - p);
7847             p = q;
7848         }
7849         if (q++ >= patend)
7850             break;
7851
7852 /*
7853     We allow format specification elements in this order:
7854         \d+\$              explicit format parameter index
7855         [-+ 0#]+           flags
7856         v|\*(\d+\$)?v      vector with optional (optionally specified) arg
7857         0                  flag (as above): repeated to allow "v02"     
7858         \d+|\*(\d+\$)?     width using optional (optionally specified) arg
7859         \.(\d*|\*(\d+\$)?) precision using optional (optionally specified) arg
7860         [hlqLV]            size
7861     [%bcdefginopsuxDFOUX] format (mandatory)
7862 */
7863
7864         if (args) {
7865 /*  
7866         As of perl5.9.3, printf format checking is on by default.
7867         Internally, perl uses %p formats to provide an escape to
7868         some extended formatting.  This block deals with those
7869         extensions: if it does not match, (char*)q is reset and
7870         the normal format processing code is used.
7871
7872         Currently defined extensions are:
7873                 %p              include pointer address (standard)      
7874                 %-p     (SVf)   include an SV (previously %_)
7875                 %-<num>p        include an SV with precision <num>      
7876                 %1p     (VDf)   include a v-string (as %vd)
7877                 %<num>p         reserved for future extensions
7878
7879         Robin Barker 2005-07-14
7880 */
7881             char* r = q; 
7882             bool sv = FALSE;    
7883             STRLEN n = 0;
7884             if (*q == '-')
7885                 sv = *q++;
7886             EXPECT_NUMBER(q, n);
7887             if (*q++ == 'p') {
7888                 if (sv) {                       /* SVf */
7889                     if (n) {
7890                         precis = n;
7891                         has_precis = TRUE;
7892                     }
7893                     argsv = va_arg(*args, SV*);
7894                     eptr = SvPVx_const(argsv, elen);
7895                     if (DO_UTF8(argsv))
7896                         is_utf8 = TRUE;
7897                     goto string;
7898                 }
7899 #if vdNUMBER
7900                 else if (n == vdNUMBER) {       /* VDf */
7901                     vectorize = TRUE;
7902                     VECTORIZE_ARGS
7903                     goto format_vd;
7904                 }
7905 #endif
7906                 else if (n) {
7907                     if (ckWARN_d(WARN_INTERNAL))
7908                         Perl_warner(aTHX_ packWARN(WARN_INTERNAL),
7909                         "internal %%<num>p might conflict with future printf extensions");
7910                 }
7911             }
7912             q = r; 
7913         }
7914
7915         if (EXPECT_NUMBER(q, width)) {
7916             if (*q == '$') {
7917                 ++q;
7918                 efix = width;
7919             } else {
7920                 goto gotwidth;
7921             }
7922         }
7923
7924         /* FLAGS */
7925
7926         while (*q) {
7927             switch (*q) {
7928             case ' ':
7929             case '+':
7930                 plus = *q++;
7931                 continue;
7932
7933             case '-':
7934                 left = TRUE;
7935                 q++;
7936                 continue;
7937
7938             case '0':
7939                 fill = *q++;
7940                 continue;
7941
7942             case '#':
7943                 alt = TRUE;
7944                 q++;
7945                 continue;
7946
7947             default:
7948                 break;
7949             }
7950             break;
7951         }
7952
7953       tryasterisk:
7954         if (*q == '*') {
7955             q++;
7956             if (EXPECT_NUMBER(q, ewix))
7957                 if (*q++ != '$')
7958                     goto unknown;
7959             asterisk = TRUE;
7960         }
7961         if (*q == 'v') {
7962             q++;
7963             if (vectorize)
7964                 goto unknown;
7965             if ((vectorarg = asterisk)) {
7966                 evix = ewix;
7967                 ewix = 0;
7968                 asterisk = FALSE;
7969             }
7970             vectorize = TRUE;
7971             goto tryasterisk;
7972         }
7973
7974         if (!asterisk)
7975         {
7976             if( *q == '0' )
7977                 fill = *q++;
7978             EXPECT_NUMBER(q, width);
7979         }
7980
7981         if (vectorize) {
7982             if (vectorarg) {
7983                 if (args)
7984                     vecsv = va_arg(*args, SV*);
7985                 else
7986                     vecsv = (evix ? evix <= svmax : svix < svmax) ?
7987                         svargs[evix ? evix-1 : svix++] : &PL_sv_undef;
7988                 dotstr = SvPV_const(vecsv, dotstrlen);
7989                 if (DO_UTF8(vecsv))
7990                     is_utf8 = TRUE;
7991             }
7992             if (args) {
7993                 VECTORIZE_ARGS
7994             }
7995             else if (efix ? efix <= svmax : svix < svmax) {
7996                 vecsv = svargs[efix ? efix-1 : svix++];
7997                 vecstr = (U8*)SvPV_const(vecsv,veclen);
7998                 vec_utf8 = DO_UTF8(vecsv);
7999                 /* if this is a version object, we need to return the
8000                  * stringified representation (which the SvPVX_const has
8001                  * already done for us), but not vectorize the args
8002                  */
8003                 if ( *q == 'd' && sv_derived_from(vecsv,"version") )
8004                 {
8005                         q++; /* skip past the rest of the %vd format */
8006                         eptr = (const char *) vecstr;
8007                         elen = veclen;
8008                         vectorize=FALSE;
8009                         goto string;
8010                 }
8011             }
8012             else {
8013                 vecstr = (U8*)"";
8014                 veclen = 0;
8015             }
8016         }
8017
8018         if (asterisk) {
8019             if (args)
8020                 i = va_arg(*args, int);
8021             else
8022                 i = (ewix ? ewix <= svmax : svix < svmax) ?
8023                     SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8024             left |= (i < 0);
8025             width = (i < 0) ? -i : i;
8026         }
8027       gotwidth:
8028
8029         /* PRECISION */
8030
8031         if (*q == '.') {
8032             q++;
8033             if (*q == '*') {
8034                 q++;
8035                 if (EXPECT_NUMBER(q, epix) && *q++ != '$')
8036                     goto unknown;
8037                 /* XXX: todo, support specified precision parameter */
8038                 if (epix)
8039                     goto unknown;
8040                 if (args)
8041                     i = va_arg(*args, int);
8042                 else
8043                     i = (ewix ? ewix <= svmax : svix < svmax)
8044                         ? SvIVx(svargs[ewix ? ewix-1 : svix++]) : 0;
8045                 precis = (i < 0) ? 0 : i;
8046             }
8047             else {
8048                 precis = 0;
8049                 while (isDIGIT(*q))
8050                     precis = precis * 10 + (*q++ - '0');
8051             }
8052             has_precis = TRUE;
8053         }
8054
8055         /* SIZE */
8056
8057         switch (*q) {
8058 #ifdef WIN32
8059         case 'I':                       /* Ix, I32x, and I64x */
8060 #  ifdef WIN64
8061             if (q[1] == '6' && q[2] == '4') {
8062                 q += 3;
8063                 intsize = 'q';
8064                 break;
8065             }
8066 #  endif
8067             if (q[1] == '3' && q[2] == '2') {
8068                 q += 3;
8069                 break;
8070             }
8071 #  ifdef WIN64
8072             intsize = 'q';
8073 #  endif
8074             q++;
8075             break;
8076 #endif
8077 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8078         case 'L':                       /* Ld */
8079             /* FALL THROUGH */
8080 #ifdef HAS_QUAD
8081         case 'q':                       /* qd */
8082 #endif
8083             intsize = 'q';
8084             q++;
8085             break;
8086 #endif
8087         case 'l':
8088 #if defined(HAS_QUAD) || defined(HAS_LONG_DOUBLE)
8089             if (*(q + 1) == 'l') {      /* lld, llf */
8090                 intsize = 'q';
8091                 q += 2;
8092                 break;
8093              }
8094 #endif
8095             /* FALL THROUGH */
8096         case 'h':
8097             /* FALL THROUGH */
8098         case 'V':
8099             intsize = *q++;
8100             break;
8101         }
8102
8103         /* CONVERSION */
8104
8105         if (*q == '%') {
8106             eptr = q++;
8107             elen = 1;
8108             goto string;
8109         }
8110
8111         if (vectorize)
8112             argsv = vecsv;
8113         else if (!args) {
8114             if (efix) {
8115                 const I32 i = efix-1;
8116                 argsv = (i >= 0 && i < svmax) ? svargs[i] : &PL_sv_undef;
8117             } else {
8118                 argsv = (svix >= 0 && svix < svmax)
8119                     ? svargs[svix++] : &PL_sv_undef;
8120             }
8121         }
8122
8123         switch (c = *q++) {
8124
8125             /* STRINGS */
8126
8127         case 'c':
8128             uv = (args && !vectorize) ? va_arg(*args, int) : SvIVx(argsv);
8129             if ((uv > 255 ||
8130                  (!UNI_IS_INVARIANT(uv) && SvUTF8(sv)))
8131                 && !IN_BYTES) {
8132                 eptr = (char*)utf8buf;
8133                 elen = uvchr_to_utf8((U8*)eptr, uv) - utf8buf;
8134                 is_utf8 = TRUE;
8135             }
8136             else {
8137                 c = (char)uv;
8138                 eptr = &c;
8139                 elen = 1;
8140             }
8141             goto string;
8142
8143         case 's':
8144             if (args && !vectorize) {
8145                 eptr = va_arg(*args, char*);
8146                 if (eptr)
8147 #ifdef MACOS_TRADITIONAL
8148                   /* On MacOS, %#s format is used for Pascal strings */
8149                   if (alt)
8150                     elen = *eptr++;
8151                   else
8152 #endif
8153                     elen = strlen(eptr);
8154                 else {
8155                     eptr = (char *)nullstr;
8156                     elen = sizeof nullstr - 1;
8157                 }
8158             }
8159             else {
8160                 eptr = SvPVx_const(argsv, elen);
8161                 if (DO_UTF8(argsv)) {
8162                     if (has_precis && precis < elen) {
8163                         I32 p = precis;
8164                         sv_pos_u2b(argsv, &p, 0); /* sticks at end */
8165                         precis = p;
8166                     }
8167                     if (width) { /* fudge width (can't fudge elen) */
8168                         width += elen - sv_len_utf8(argsv);
8169                     }
8170                     is_utf8 = TRUE;
8171                 }
8172             }
8173
8174         string:
8175             vectorize = FALSE;
8176             if (has_precis && elen > precis)
8177                 elen = precis;
8178             break;
8179
8180             /* INTEGERS */
8181
8182         case 'p':
8183             if (alt || vectorize)
8184                 goto unknown;
8185             uv = PTR2UV(args ? va_arg(*args, void*) : argsv);
8186             base = 16;
8187             goto integer;
8188
8189         case 'D':
8190 #ifdef IV_IS_QUAD
8191             intsize = 'q';
8192 #else
8193             intsize = 'l';
8194 #endif
8195             /* FALL THROUGH */
8196         case 'd':
8197         case 'i':
8198 #if vdNUMBER
8199         format_vd:
8200 #endif
8201             if (vectorize) {
8202                 STRLEN ulen;
8203                 if (!veclen)
8204                     continue;
8205                 if (vec_utf8)
8206                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8207                                         UTF8_ALLOW_ANYUV);
8208                 else {
8209                     uv = *vecstr;
8210                     ulen = 1;
8211                 }
8212                 vecstr += ulen;
8213                 veclen -= ulen;
8214                 if (plus)
8215                      esignbuf[esignlen++] = plus;
8216             }
8217             else if (args) {
8218                 switch (intsize) {
8219                 case 'h':       iv = (short)va_arg(*args, int); break;
8220                 case 'l':       iv = va_arg(*args, long); break;
8221                 case 'V':       iv = va_arg(*args, IV); break;
8222                 default:        iv = va_arg(*args, int); break;
8223 #ifdef HAS_QUAD
8224                 case 'q':       iv = va_arg(*args, Quad_t); break;
8225 #endif
8226                 }
8227             }
8228             else {
8229                 IV tiv = SvIVx(argsv); /* work around GCC bug #13488 */
8230                 switch (intsize) {
8231                 case 'h':       iv = (short)tiv; break;
8232                 case 'l':       iv = (long)tiv; break;
8233                 case 'V':
8234                 default:        iv = tiv; break;
8235 #ifdef HAS_QUAD
8236                 case 'q':       iv = (Quad_t)tiv; break;
8237 #endif
8238                 }
8239             }
8240             if ( !vectorize )   /* we already set uv above */
8241             {
8242                 if (iv >= 0) {
8243                     uv = iv;
8244                     if (plus)
8245                         esignbuf[esignlen++] = plus;
8246                 }
8247                 else {
8248                     uv = -iv;
8249                     esignbuf[esignlen++] = '-';
8250                 }
8251             }
8252             base = 10;
8253             goto integer;
8254
8255         case 'U':
8256 #ifdef IV_IS_QUAD
8257             intsize = 'q';
8258 #else
8259             intsize = 'l';
8260 #endif
8261             /* FALL THROUGH */
8262         case 'u':
8263             base = 10;
8264             goto uns_integer;
8265
8266         case 'b':
8267             base = 2;
8268             goto uns_integer;
8269
8270         case 'O':
8271 #ifdef IV_IS_QUAD
8272             intsize = 'q';
8273 #else
8274             intsize = 'l';
8275 #endif
8276             /* FALL THROUGH */
8277         case 'o':
8278             base = 8;
8279             goto uns_integer;
8280
8281         case 'X':
8282         case 'x':
8283             base = 16;
8284
8285         uns_integer:
8286             if (vectorize) {
8287                 STRLEN ulen;
8288         vector:
8289                 if (!veclen)
8290                     continue;
8291                 if (vec_utf8)
8292                     uv = utf8n_to_uvchr(vecstr, veclen, &ulen,
8293                                         UTF8_ALLOW_ANYUV);
8294                 else {
8295                     uv = *vecstr;
8296                     ulen = 1;
8297                 }
8298                 vecstr += ulen;
8299                 veclen -= ulen;
8300             }
8301             else if (args) {
8302                 switch (intsize) {
8303                 case 'h':  uv = (unsigned short)va_arg(*args, unsigned); break;
8304                 case 'l':  uv = va_arg(*args, unsigned long); break;
8305                 case 'V':  uv = va_arg(*args, UV); break;
8306                 default:   uv = va_arg(*args, unsigned); break;
8307 #ifdef HAS_QUAD
8308                 case 'q':  uv = va_arg(*args, Uquad_t); break;
8309 #endif
8310                 }
8311             }
8312             else {
8313                 UV tuv = SvUVx(argsv); /* work around GCC bug #13488 */
8314                 switch (intsize) {
8315                 case 'h':       uv = (unsigned short)tuv; break;
8316                 case 'l':       uv = (unsigned long)tuv; break;
8317                 case 'V':
8318                 default:        uv = tuv; break;
8319 #ifdef HAS_QUAD
8320                 case 'q':       uv = (Uquad_t)tuv; break;
8321 #endif
8322                 }
8323             }
8324
8325         integer:
8326             {
8327                 char *ptr = ebuf + sizeof ebuf;
8328                 switch (base) {
8329                     unsigned dig;
8330                 case 16:
8331                     if (!uv)
8332                         alt = FALSE;
8333                     p = (char*)((c == 'X')
8334                                 ? "0123456789ABCDEF" : "0123456789abcdef");
8335                     do {
8336                         dig = uv & 15;
8337                         *--ptr = p[dig];
8338                     } while (uv >>= 4);
8339                     if (alt) {
8340                         esignbuf[esignlen++] = '0';
8341                         esignbuf[esignlen++] = c;  /* 'x' or 'X' */
8342                     }
8343                     break;
8344                 case 8:
8345                     do {
8346                         dig = uv & 7;
8347                         *--ptr = '0' + dig;
8348                     } while (uv >>= 3);
8349                     if (alt && *ptr != '0')
8350                         *--ptr = '0';
8351                     break;
8352                 case 2:
8353                     if (!uv)
8354                         alt = FALSE;
8355                     do {
8356                         dig = uv & 1;
8357                         *--ptr = '0' + dig;
8358                     } while (uv >>= 1);
8359                     if (alt) {
8360                         esignbuf[esignlen++] = '0';
8361                         esignbuf[esignlen++] = 'b';
8362                     }
8363                     break;
8364                 default:                /* it had better be ten or less */
8365                     do {
8366                         dig = uv % base;
8367                         *--ptr = '0' + dig;
8368                     } while (uv /= base);
8369                     break;
8370                 }
8371                 elen = (ebuf + sizeof ebuf) - ptr;
8372                 eptr = ptr;
8373                 if (has_precis) {
8374                     if (precis > elen)
8375                         zeros = precis - elen;
8376                     else if (precis == 0 && elen == 1 && *eptr == '0')
8377                         elen = 0;
8378                 }
8379             }
8380             break;
8381
8382             /* FLOATING POINT */
8383
8384         case 'F':
8385             c = 'f';            /* maybe %F isn't supported here */
8386             /* FALL THROUGH */
8387         case 'e': case 'E':
8388         case 'f':
8389         case 'g': case 'G':
8390
8391             /* This is evil, but floating point is even more evil */
8392
8393             /* for SV-style calling, we can only get NV
8394                for C-style calling, we assume %f is double;
8395                for simplicity we allow any of %Lf, %llf, %qf for long double
8396             */
8397             switch (intsize) {
8398             case 'V':
8399 #if defined(USE_LONG_DOUBLE)
8400                 intsize = 'q';
8401 #endif
8402                 break;
8403 /* [perl #20339] - we should accept and ignore %lf rather than die */
8404             case 'l':
8405                 /* FALL THROUGH */
8406             default:
8407 #if defined(USE_LONG_DOUBLE)
8408                 intsize = args ? 0 : 'q';
8409 #endif
8410                 break;
8411             case 'q':
8412 #if defined(HAS_LONG_DOUBLE)
8413                 break;
8414 #else
8415                 /* FALL THROUGH */
8416 #endif
8417             case 'h':
8418                 goto unknown;
8419             }
8420
8421             /* now we need (long double) if intsize == 'q', else (double) */
8422             nv = (args && !vectorize) ?
8423 #if LONG_DOUBLESIZE > DOUBLESIZE
8424                 intsize == 'q' ?
8425                     va_arg(*args, long double) :
8426                     va_arg(*args, double)
8427 #else
8428                     va_arg(*args, double)
8429 #endif
8430                 : SvNVx(argsv);
8431
8432             need = 0;
8433             vectorize = FALSE;
8434             if (c != 'e' && c != 'E') {
8435                 i = PERL_INT_MIN;
8436                 /* FIXME: if HAS_LONG_DOUBLE but not USE_LONG_DOUBLE this
8437                    will cast our (long double) to (double) */
8438                 (void)Perl_frexp(nv, &i);
8439                 if (i == PERL_INT_MIN)
8440                     Perl_die(aTHX_ "panic: frexp");
8441                 if (i > 0)
8442                     need = BIT_DIGITS(i);
8443             }
8444             need += has_precis ? precis : 6; /* known default */
8445
8446             if (need < width)
8447                 need = width;
8448
8449 #ifdef HAS_LDBL_SPRINTF_BUG
8450             /* This is to try to fix a bug with irix/nonstop-ux/powerux and
8451                with sfio - Allen <allens@cpan.org> */
8452
8453 #  ifdef DBL_MAX
8454 #    define MY_DBL_MAX DBL_MAX
8455 #  else /* XXX guessing! HUGE_VAL may be defined as infinity, so not using */
8456 #    if DOUBLESIZE >= 8
8457 #      define MY_DBL_MAX 1.7976931348623157E+308L
8458 #    else
8459 #      define MY_DBL_MAX 3.40282347E+38L
8460 #    endif
8461 #  endif
8462
8463 #  ifdef HAS_LDBL_SPRINTF_BUG_LESS1 /* only between -1L & 1L - Allen */
8464 #    define MY_DBL_MAX_BUG 1L
8465 #  else
8466 #    define MY_DBL_MAX_BUG MY_DBL_MAX
8467 #  endif
8468
8469 #  ifdef DBL_MIN
8470 #    define MY_DBL_MIN DBL_MIN
8471 #  else  /* XXX guessing! -Allen */
8472 #    if DOUBLESIZE >= 8
8473 #      define MY_DBL_MIN 2.2250738585072014E-308L
8474 #    else
8475 #      define MY_DBL_MIN 1.17549435E-38L
8476 #    endif
8477 #  endif
8478
8479             if ((intsize == 'q') && (c == 'f') &&
8480                 ((nv < MY_DBL_MAX_BUG) && (nv > -MY_DBL_MAX_BUG)) &&
8481                 (need < DBL_DIG)) {
8482                 /* it's going to be short enough that
8483                  * long double precision is not needed */
8484
8485                 if ((nv <= 0L) && (nv >= -0L))
8486                     fix_ldbl_sprintf_bug = TRUE; /* 0 is 0 - easiest */
8487                 else {
8488                     /* would use Perl_fp_class as a double-check but not
8489                      * functional on IRIX - see perl.h comments */
8490
8491                     if ((nv >= MY_DBL_MIN) || (nv <= -MY_DBL_MIN)) {
8492                         /* It's within the range that a double can represent */
8493 #if defined(DBL_MAX) && !defined(DBL_MIN)
8494                         if ((nv >= ((long double)1/DBL_MAX)) ||
8495                             (nv <= (-(long double)1/DBL_MAX)))
8496 #endif
8497                         fix_ldbl_sprintf_bug = TRUE;
8498                     }
8499                 }
8500                 if (fix_ldbl_sprintf_bug == TRUE) {
8501                     double temp;
8502
8503                     intsize = 0;
8504                     temp = (double)nv;
8505                     nv = (NV)temp;
8506                 }
8507             }
8508
8509 #  undef MY_DBL_MAX
8510 #  undef MY_DBL_MAX_BUG
8511 #  undef MY_DBL_MIN
8512
8513 #endif /* HAS_LDBL_SPRINTF_BUG */
8514
8515             need += 20; /* fudge factor */
8516             if (PL_efloatsize < need) {
8517                 Safefree(PL_efloatbuf);
8518                 PL_efloatsize = need + 20; /* more fudge */
8519                 Newx(PL_efloatbuf, PL_efloatsize, char);
8520                 PL_efloatbuf[0] = '\0';
8521             }
8522
8523             if ( !(width || left || plus || alt) && fill != '0'
8524                  && has_precis && intsize != 'q' ) {    /* Shortcuts */
8525                 /* See earlier comment about buggy Gconvert when digits,
8526                    aka precis is 0  */
8527                 if ( c == 'g' && precis) {
8528                     Gconvert((NV)nv, (int)precis, 0, PL_efloatbuf);
8529                     /* May return an empty string for digits==0 */
8530                     if (*PL_efloatbuf) {
8531                         elen = strlen(PL_efloatbuf);
8532                         goto float_converted;
8533                     }
8534                 } else if ( c == 'f' && !precis) {
8535                     if ((eptr = F0convert(nv, ebuf + sizeof ebuf, &elen)))
8536                         break;
8537                 }
8538             }
8539             {
8540                 char *ptr = ebuf + sizeof ebuf;
8541                 *--ptr = '\0';
8542                 *--ptr = c;
8543                 /* FIXME: what to do if HAS_LONG_DOUBLE but not PERL_PRIfldbl? */
8544 #if defined(HAS_LONG_DOUBLE) && defined(PERL_PRIfldbl)
8545                 if (intsize == 'q') {
8546                     /* Copy the one or more characters in a long double
8547                      * format before the 'base' ([efgEFG]) character to
8548                      * the format string. */
8549                     static char const prifldbl[] = PERL_PRIfldbl;
8550                     char const *p = prifldbl + sizeof(prifldbl) - 3;
8551                     while (p >= prifldbl) { *--ptr = *p--; }
8552                 }
8553 #endif
8554                 if (has_precis) {
8555                     base = precis;
8556                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8557                     *--ptr = '.';
8558                 }
8559                 if (width) {
8560                     base = width;
8561                     do { *--ptr = '0' + (base % 10); } while (base /= 10);
8562                 }
8563                 if (fill == '0')
8564                     *--ptr = fill;
8565                 if (left)
8566                     *--ptr = '-';
8567                 if (plus)
8568                     *--ptr = plus;
8569                 if (alt)
8570                     *--ptr = '#';
8571                 *--ptr = '%';
8572
8573                 /* No taint.  Otherwise we are in the strange situation
8574                  * where printf() taints but print($float) doesn't.
8575                  * --jhi */
8576 #if defined(HAS_LONG_DOUBLE)
8577                 elen = ((intsize == 'q')
8578                         ? my_sprintf(PL_efloatbuf, ptr, nv)
8579                         : my_sprintf(PL_efloatbuf, ptr, (double)nv));
8580 #else
8581                 elen = my_sprintf(PL_efloatbuf, ptr, nv);
8582 #endif
8583             }
8584         float_converted:
8585             eptr = PL_efloatbuf;
8586             break;
8587
8588             /* SPECIAL */
8589
8590         case 'n':
8591             i = SvCUR(sv) - origlen;
8592             if (args && !vectorize) {
8593                 switch (intsize) {
8594                 case 'h':       *(va_arg(*args, short*)) = i; break;
8595                 default:        *(va_arg(*args, int*)) = i; break;
8596                 case 'l':       *(va_arg(*args, long*)) = i; break;
8597                 case 'V':       *(va_arg(*args, IV*)) = i; break;
8598 #ifdef HAS_QUAD
8599                 case 'q':       *(va_arg(*args, Quad_t*)) = i; break;
8600 #endif
8601                 }
8602             }
8603             else
8604                 sv_setuv_mg(argsv, (UV)i);
8605             vectorize = FALSE;
8606             continue;   /* not "break" */
8607
8608             /* UNKNOWN */
8609
8610         default:
8611       unknown:
8612             if (!args
8613                 && (PL_op->op_type == OP_PRTF || PL_op->op_type == OP_SPRINTF)
8614                 && ckWARN(WARN_PRINTF))
8615             {
8616                 SV * const msg = sv_newmortal();
8617                 Perl_sv_setpvf(aTHX_ msg, "Invalid conversion in %sprintf: ",
8618                           (PL_op->op_type == OP_PRTF) ? "" : "s");
8619                 if (c) {
8620                     if (isPRINT(c))
8621                         Perl_sv_catpvf(aTHX_ msg,
8622                                        "\"%%%c\"", c & 0xFF);
8623                     else
8624                         Perl_sv_catpvf(aTHX_ msg,
8625                                        "\"%%\\%03"UVof"\"",
8626                                        (UV)c & 0xFF);
8627                 } else
8628                     sv_catpv(msg, "end of string");
8629                 Perl_warner(aTHX_ packWARN(WARN_PRINTF), "%"SVf, msg); /* yes, this is reentrant */
8630             }
8631
8632             /* output mangled stuff ... */
8633             if (c == '\0')
8634                 --q;
8635             eptr = p;
8636             elen = q - p;
8637
8638             /* ... right here, because formatting flags should not apply */
8639             SvGROW(sv, SvCUR(sv) + elen + 1);
8640             p = SvEND(sv);
8641             Copy(eptr, p, elen, char);
8642             p += elen;
8643             *p = '\0';
8644             SvCUR_set(sv, p - SvPVX_const(sv));
8645             svix = osvix;
8646             continue;   /* not "break" */
8647         }
8648
8649         /* calculate width before utf8_upgrade changes it */
8650         have = esignlen + zeros + elen;
8651         if (have < zeros)
8652             Perl_croak_nocontext(PL_memory_wrap);
8653
8654         if (is_utf8 != has_utf8) {
8655              if (is_utf8) {
8656                   if (SvCUR(sv))
8657                        sv_utf8_upgrade(sv);
8658              }
8659              else {
8660                   SV * const nsv = sv_2mortal(newSVpvn(eptr, elen));
8661                   sv_utf8_upgrade(nsv);
8662                   eptr = SvPVX_const(nsv);
8663                   elen = SvCUR(nsv);
8664              }
8665              SvGROW(sv, SvCUR(sv) + elen + 1);
8666              p = SvEND(sv);
8667              *p = '\0';
8668         }
8669
8670         need = (have > width ? have : width);
8671         gap = need - have;
8672
8673         if (need >= (((STRLEN)~0) - SvCUR(sv) - dotstrlen - 1))
8674             Perl_croak_nocontext(PL_memory_wrap);
8675         SvGROW(sv, SvCUR(sv) + need + dotstrlen + 1);
8676         p = SvEND(sv);
8677         if (esignlen && fill == '0') {
8678             int i;
8679             for (i = 0; i < (int)esignlen; i++)
8680                 *p++ = esignbuf[i];
8681         }
8682         if (gap && !left) {
8683             memset(p, fill, gap);
8684             p += gap;
8685         }
8686         if (esignlen && fill != '0') {
8687             int i;
8688             for (i = 0; i < (int)esignlen; i++)
8689                 *p++ = esignbuf[i];
8690         }
8691         if (zeros) {
8692             int i;
8693             for (i = zeros; i; i--)
8694                 *p++ = '0';
8695         }
8696         if (elen) {
8697             Copy(eptr, p, elen, char);
8698             p += elen;
8699         }
8700         if (gap && left) {
8701             memset(p, ' ', gap);
8702             p += gap;
8703         }
8704         if (vectorize) {
8705             if (veclen) {
8706                 Copy(dotstr, p, dotstrlen, char);
8707                 p += dotstrlen;
8708             }
8709             else
8710                 vectorize = FALSE;              /* done iterating over vecstr */
8711         }
8712         if (is_utf8)
8713             has_utf8 = TRUE;
8714         if (has_utf8)
8715             SvUTF8_on(sv);
8716         *p = '\0';
8717         SvCUR_set(sv, p - SvPVX_const(sv));
8718         if (vectorize) {
8719             esignlen = 0;
8720             goto vector;
8721         }
8722     }
8723 }
8724
8725 /* =========================================================================
8726
8727 =head1 Cloning an interpreter
8728
8729 All the macros and functions in this section are for the private use of
8730 the main function, perl_clone().
8731
8732 The foo_dup() functions make an exact copy of an existing foo thinngy.
8733 During the course of a cloning, a hash table is used to map old addresses
8734 to new addresses. The table is created and manipulated with the
8735 ptr_table_* functions.
8736
8737 =cut
8738
8739 ============================================================================*/
8740
8741
8742 #if defined(USE_ITHREADS)
8743
8744 #ifndef GpREFCNT_inc
8745 #  define GpREFCNT_inc(gp)      ((gp) ? (++(gp)->gp_refcnt, (gp)) : (GP*)NULL)
8746 #endif
8747
8748
8749 #define sv_dup_inc(s,t) SvREFCNT_inc(sv_dup(s,t))
8750 #define av_dup(s,t)     (AV*)sv_dup((SV*)s,t)
8751 #define av_dup_inc(s,t) (AV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8752 #define hv_dup(s,t)     (HV*)sv_dup((SV*)s,t)
8753 #define hv_dup_inc(s,t) (HV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8754 #define cv_dup(s,t)     (CV*)sv_dup((SV*)s,t)
8755 #define cv_dup_inc(s,t) (CV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8756 #define io_dup(s,t)     (IO*)sv_dup((SV*)s,t)
8757 #define io_dup_inc(s,t) (IO*)SvREFCNT_inc(sv_dup((SV*)s,t))
8758 #define gv_dup(s,t)     (GV*)sv_dup((SV*)s,t)
8759 #define gv_dup_inc(s,t) (GV*)SvREFCNT_inc(sv_dup((SV*)s,t))
8760 #define SAVEPV(p)       (p ? savepv(p) : Nullch)
8761 #define SAVEPVN(p,n)    (p ? savepvn(p,n) : Nullch)
8762
8763
8764 /* Duplicate a regexp. Required reading: pregcomp() and pregfree() in
8765    regcomp.c. AMS 20010712 */
8766
8767 REGEXP *
8768 Perl_re_dup(pTHX_ const REGEXP *r, CLONE_PARAMS *param)
8769 {
8770     dVAR;
8771     REGEXP *ret;
8772     int i, len, npar;
8773     struct reg_substr_datum *s;
8774
8775     if (!r)
8776         return (REGEXP *)NULL;
8777
8778     if ((ret = (REGEXP *)ptr_table_fetch(PL_ptr_table, r)))
8779         return ret;
8780
8781     len = r->offsets[0];
8782     npar = r->nparens+1;
8783
8784     Newxc(ret, sizeof(regexp) + (len+1)*sizeof(regnode), char, regexp);
8785     Copy(r->program, ret->program, len+1, regnode);
8786
8787     Newx(ret->startp, npar, I32);
8788     Copy(r->startp, ret->startp, npar, I32);
8789     Newx(ret->endp, npar, I32);
8790     Copy(r->startp, ret->startp, npar, I32);
8791
8792     Newx(ret->substrs, 1, struct reg_substr_data);
8793     for (s = ret->substrs->data, i = 0; i < 3; i++, s++) {
8794         s->min_offset = r->substrs->data[i].min_offset;
8795         s->max_offset = r->substrs->data[i].max_offset;
8796         s->substr     = sv_dup_inc(r->substrs->data[i].substr, param);
8797         s->utf8_substr = sv_dup_inc(r->substrs->data[i].utf8_substr, param);
8798     }
8799
8800     ret->regstclass = NULL;
8801     if (r->data) {
8802         struct reg_data *d;
8803         const int count = r->data->count;
8804         int i;
8805
8806         Newxc(d, sizeof(struct reg_data) + count*sizeof(void *),
8807                 char, struct reg_data);
8808         Newx(d->what, count, U8);
8809
8810         d->count = count;
8811         for (i = 0; i < count; i++) {
8812             d->what[i] = r->data->what[i];
8813             switch (d->what[i]) {
8814                 /* legal options are one of: sfpont
8815                    see also regcomp.h and pregfree() */
8816             case 's':
8817                 d->data[i] = sv_dup_inc((SV *)r->data->data[i], param);
8818                 break;
8819             case 'p':
8820                 d->data[i] = av_dup_inc((AV *)r->data->data[i], param);
8821                 break;
8822             case 'f':
8823                 /* This is cheating. */
8824                 Newx(d->data[i], 1, struct regnode_charclass_class);
8825                 StructCopy(r->data->data[i], d->data[i],
8826                             struct regnode_charclass_class);
8827                 ret->regstclass = (regnode*)d->data[i];
8828                 break;
8829             case 'o':
8830                 /* Compiled op trees are readonly, and can thus be
8831                    shared without duplication. */
8832                 OP_REFCNT_LOCK;
8833                 d->data[i] = (void*)OpREFCNT_inc((OP*)r->data->data[i]);
8834                 OP_REFCNT_UNLOCK;
8835                 break;
8836             case 'n':
8837                 d->data[i] = r->data->data[i];
8838                 break;
8839             case 't':
8840                 d->data[i] = r->data->data[i];
8841                 OP_REFCNT_LOCK;
8842                 ((reg_trie_data*)d->data[i])->refcount++;
8843                 OP_REFCNT_UNLOCK;
8844                 break;
8845             default:
8846                 Perl_croak(aTHX_ "panic: re_dup unknown data code '%c'", r->data->what[i]);
8847             }
8848         }
8849
8850         ret->data = d;
8851     }
8852     else
8853         ret->data = NULL;
8854
8855     Newx(ret->offsets, 2*len+1, U32);
8856     Copy(r->offsets, ret->offsets, 2*len+1, U32);
8857
8858     ret->precomp        = SAVEPVN(r->precomp, r->prelen);
8859     ret->refcnt         = r->refcnt;
8860     ret->minlen         = r->minlen;
8861     ret->prelen         = r->prelen;
8862     ret->nparens        = r->nparens;
8863     ret->lastparen      = r->lastparen;
8864     ret->lastcloseparen = r->lastcloseparen;
8865     ret->reganch        = r->reganch;
8866
8867     ret->sublen         = r->sublen;
8868
8869     if (RX_MATCH_COPIED(ret))
8870         ret->subbeg  = SAVEPVN(r->subbeg, r->sublen);
8871     else
8872         ret->subbeg = Nullch;
8873 #ifdef PERL_OLD_COPY_ON_WRITE
8874     ret->saved_copy = Nullsv;
8875 #endif
8876
8877     ptr_table_store(PL_ptr_table, r, ret);
8878     return ret;
8879 }
8880
8881 /* duplicate a file handle */
8882
8883 PerlIO *
8884 Perl_fp_dup(pTHX_ PerlIO *fp, char type, CLONE_PARAMS *param)
8885 {
8886     PerlIO *ret;
8887
8888     PERL_UNUSED_ARG(type);
8889
8890     if (!fp)
8891         return (PerlIO*)NULL;
8892
8893     /* look for it in the table first */
8894     ret = (PerlIO*)ptr_table_fetch(PL_ptr_table, fp);
8895     if (ret)
8896         return ret;
8897
8898     /* create anew and remember what it is */
8899     ret = PerlIO_fdupopen(aTHX_ fp, param, PERLIO_DUP_CLONE);
8900     ptr_table_store(PL_ptr_table, fp, ret);
8901     return ret;
8902 }
8903
8904 /* duplicate a directory handle */
8905
8906 DIR *
8907 Perl_dirp_dup(pTHX_ DIR *dp)
8908 {
8909     if (!dp)
8910         return (DIR*)NULL;
8911     /* XXX TODO */
8912     return dp;
8913 }
8914
8915 /* duplicate a typeglob */
8916
8917 GP *
8918 Perl_gp_dup(pTHX_ GP *gp, CLONE_PARAMS* param)
8919 {
8920     GP *ret;
8921     if (!gp)
8922         return (GP*)NULL;
8923     /* look for it in the table first */
8924     ret = (GP*)ptr_table_fetch(PL_ptr_table, gp);
8925     if (ret)
8926         return ret;
8927
8928     /* create anew and remember what it is */
8929     Newxz(ret, 1, GP);
8930     ptr_table_store(PL_ptr_table, gp, ret);
8931
8932     /* clone */
8933     ret->gp_refcnt      = 0;                    /* must be before any other dups! */
8934     ret->gp_sv          = sv_dup_inc(gp->gp_sv, param);
8935     ret->gp_io          = io_dup_inc(gp->gp_io, param);
8936     ret->gp_form        = cv_dup_inc(gp->gp_form, param);
8937     ret->gp_av          = av_dup_inc(gp->gp_av, param);
8938     ret->gp_hv          = hv_dup_inc(gp->gp_hv, param);
8939     ret->gp_egv = gv_dup(gp->gp_egv, param);/* GvEGV is not refcounted */
8940     ret->gp_cv          = cv_dup_inc(gp->gp_cv, param);
8941     ret->gp_cvgen       = gp->gp_cvgen;
8942     ret->gp_line        = gp->gp_line;
8943     ret->gp_file        = gp->gp_file;          /* points to COP.cop_file */
8944     return ret;
8945 }
8946
8947 /* duplicate a chain of magic */
8948
8949 MAGIC *
8950 Perl_mg_dup(pTHX_ MAGIC *mg, CLONE_PARAMS* param)
8951 {
8952     MAGIC *mgprev = (MAGIC*)NULL;
8953     MAGIC *mgret;
8954     if (!mg)
8955         return (MAGIC*)NULL;
8956     /* look for it in the table first */
8957     mgret = (MAGIC*)ptr_table_fetch(PL_ptr_table, mg);
8958     if (mgret)
8959         return mgret;
8960
8961     for (; mg; mg = mg->mg_moremagic) {
8962         MAGIC *nmg;
8963         Newxz(nmg, 1, MAGIC);
8964         if (mgprev)
8965             mgprev->mg_moremagic = nmg;
8966         else
8967             mgret = nmg;
8968         nmg->mg_virtual = mg->mg_virtual;       /* XXX copy dynamic vtable? */
8969         nmg->mg_private = mg->mg_private;
8970         nmg->mg_type    = mg->mg_type;
8971         nmg->mg_flags   = mg->mg_flags;
8972         if (mg->mg_type == PERL_MAGIC_qr) {
8973             nmg->mg_obj = (SV*)re_dup((REGEXP*)mg->mg_obj, param);
8974         }
8975         else if(mg->mg_type == PERL_MAGIC_backref) {
8976             const AV * const av = (AV*) mg->mg_obj;
8977             SV **svp;
8978             I32 i;
8979             (void)SvREFCNT_inc(nmg->mg_obj = (SV*)newAV());
8980             svp = AvARRAY(av);
8981             for (i = AvFILLp(av); i >= 0; i--) {
8982                 if (!svp[i]) continue;
8983                 av_push((AV*)nmg->mg_obj,sv_dup(svp[i],param));
8984             }
8985         }
8986         else if (mg->mg_type == PERL_MAGIC_symtab) {
8987             nmg->mg_obj = mg->mg_obj;
8988         }
8989         else {
8990             nmg->mg_obj = (mg->mg_flags & MGf_REFCOUNTED)
8991                               ? sv_dup_inc(mg->mg_obj, param)
8992                               : sv_dup(mg->mg_obj, param);
8993         }
8994         nmg->mg_len     = mg->mg_len;
8995         nmg->mg_ptr     = mg->mg_ptr;   /* XXX random ptr? */
8996         if (mg->mg_ptr && mg->mg_type != PERL_MAGIC_regex_global) {
8997             if (mg->mg_len > 0) {
8998                 nmg->mg_ptr     = SAVEPVN(mg->mg_ptr, mg->mg_len);
8999                 if (mg->mg_type == PERL_MAGIC_overload_table &&
9000                         AMT_AMAGIC((AMT*)mg->mg_ptr))
9001                 {
9002                     AMT * const amtp = (AMT*)mg->mg_ptr;
9003                     AMT * const namtp = (AMT*)nmg->mg_ptr;
9004                     I32 i;
9005                     for (i = 1; i < NofAMmeth; i++) {
9006                         namtp->table[i] = cv_dup_inc(amtp->table[i], param);
9007                     }
9008                 }
9009             }
9010             else if (mg->mg_len == HEf_SVKEY)
9011                 nmg->mg_ptr     = (char*)sv_dup_inc((SV*)mg->mg_ptr, param);
9012         }
9013         if ((mg->mg_flags & MGf_DUP) && mg->mg_virtual && mg->mg_virtual->svt_dup) {
9014             CALL_FPTR(nmg->mg_virtual->svt_dup)(aTHX_ nmg, param);
9015         }
9016         mgprev = nmg;
9017     }
9018     return mgret;
9019 }
9020
9021 /* create a new pointer-mapping table */
9022
9023 PTR_TBL_t *
9024 Perl_ptr_table_new(pTHX)
9025 {
9026     PTR_TBL_t *tbl;
9027     Newxz(tbl, 1, PTR_TBL_t);
9028     tbl->tbl_max        = 511;
9029     tbl->tbl_items      = 0;
9030     Newxz(tbl->tbl_ary, tbl->tbl_max + 1, PTR_TBL_ENT_t*);
9031     return tbl;
9032 }
9033
9034 #if (PTRSIZE == 8)
9035 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 3)
9036 #else
9037 #  define PTR_TABLE_HASH(ptr) (PTR2UV(ptr) >> 2)
9038 #endif
9039
9040 /* 
9041    we use the PTE_SVSLOT 'reservation' made above, both here (in the
9042    following define) and at call to new_body_inline made below in 
9043    Perl_ptr_table_store()
9044  */
9045
9046 #define del_pte(p)     del_body_type(p, PTE_SVSLOT)
9047
9048 /* map an existing pointer using a table */
9049
9050 void *
9051 Perl_ptr_table_fetch(pTHX_ PTR_TBL_t *tbl, const void *sv)
9052 {
9053     PTR_TBL_ENT_t *tblent;
9054     const UV hash = PTR_TABLE_HASH(sv);
9055     assert(tbl);
9056     tblent = tbl->tbl_ary[hash & tbl->tbl_max];
9057     for (; tblent; tblent = tblent->next) {
9058         if (tblent->oldval == sv)
9059             return tblent->newval;
9060     }
9061     return (void*)NULL;
9062 }
9063
9064 /* add a new entry to a pointer-mapping table */
9065
9066 void
9067 Perl_ptr_table_store(pTHX_ PTR_TBL_t *tbl, const void *oldsv, void *newsv)
9068 {
9069     PTR_TBL_ENT_t *tblent, **otblent;
9070     /* XXX this may be pessimal on platforms where pointers aren't good
9071      * hash values e.g. if they grow faster in the most significant
9072      * bits */
9073     const UV hash = PTR_TABLE_HASH(oldsv);
9074     bool empty = 1;
9075
9076     assert(tbl);
9077     otblent = &tbl->tbl_ary[hash & tbl->tbl_max];
9078     for (tblent = *otblent; tblent; empty=0, tblent = tblent->next) {
9079         if (tblent->oldval == oldsv) {
9080             tblent->newval = newsv;
9081             return;
9082         }
9083     }
9084     new_body_inline(tblent, sizeof(struct ptr_tbl_ent), PTE_SVSLOT);
9085     tblent->oldval = oldsv;
9086     tblent->newval = newsv;
9087     tblent->next = *otblent;
9088     *otblent = tblent;
9089     tbl->tbl_items++;
9090     if (!empty && tbl->tbl_items > tbl->tbl_max)
9091         ptr_table_split(tbl);
9092 }
9093
9094 /* double the hash bucket size of an existing ptr table */
9095
9096 void
9097 Perl_ptr_table_split(pTHX_ PTR_TBL_t *tbl)
9098 {
9099     PTR_TBL_ENT_t **ary = tbl->tbl_ary;
9100     const UV oldsize = tbl->tbl_max + 1;
9101     UV newsize = oldsize * 2;
9102     UV i;
9103
9104     Renew(ary, newsize, PTR_TBL_ENT_t*);
9105     Zero(&ary[oldsize], newsize-oldsize, PTR_TBL_ENT_t*);
9106     tbl->tbl_max = --newsize;
9107     tbl->tbl_ary = ary;
9108     for (i=0; i < oldsize; i++, ary++) {
9109         PTR_TBL_ENT_t **curentp, **entp, *ent;
9110         if (!*ary)
9111             continue;
9112         curentp = ary + oldsize;
9113         for (entp = ary, ent = *ary; ent; ent = *entp) {
9114             if ((newsize & PTR_TABLE_HASH(ent->oldval)) != i) {
9115                 *entp = ent->next;
9116                 ent->next = *curentp;
9117                 *curentp = ent;
9118                 continue;
9119             }
9120             else
9121                 entp = &ent->next;
9122         }
9123     }
9124 }
9125
9126 /* remove all the entries from a ptr table */
9127
9128 void
9129 Perl_ptr_table_clear(pTHX_ PTR_TBL_t *tbl)
9130 {
9131     register PTR_TBL_ENT_t **array;
9132     register PTR_TBL_ENT_t *entry;
9133     UV riter = 0;
9134     UV max;
9135
9136     if (!tbl || !tbl->tbl_items) {
9137         return;
9138     }
9139
9140     array = tbl->tbl_ary;
9141     entry = array[0];
9142     max = tbl->tbl_max;
9143
9144     for (;;) {
9145         if (entry) {
9146             PTR_TBL_ENT_t *oentry = entry;
9147             entry = entry->next;
9148             del_pte(oentry);
9149         }
9150         if (!entry) {
9151             if (++riter > max) {
9152                 break;
9153             }
9154             entry = array[riter];
9155         }
9156     }
9157
9158     tbl->tbl_items = 0;
9159 }
9160
9161 /* clear and free a ptr table */
9162
9163 void
9164 Perl_ptr_table_free(pTHX_ PTR_TBL_t *tbl)
9165 {
9166     if (!tbl) {
9167         return;
9168     }
9169     ptr_table_clear(tbl);
9170     Safefree(tbl->tbl_ary);
9171     Safefree(tbl);
9172 }
9173
9174
9175 void
9176 Perl_rvpv_dup(pTHX_ SV *dstr, SV *sstr, CLONE_PARAMS* param)
9177 {
9178     if (SvROK(sstr)) {
9179         SvRV_set(dstr, SvWEAKREF(sstr)
9180                        ? sv_dup(SvRV(sstr), param)
9181                        : sv_dup_inc(SvRV(sstr), param));
9182
9183     }
9184     else if (SvPVX_const(sstr)) {
9185         /* Has something there */
9186         if (SvLEN(sstr)) {
9187             /* Normal PV - clone whole allocated space */
9188             SvPV_set(dstr, SAVEPVN(SvPVX_const(sstr), SvLEN(sstr)-1));
9189             if (SvREADONLY(sstr) && SvFAKE(sstr)) {
9190                 /* Not that normal - actually sstr is copy on write.
9191                    But we are a true, independant SV, so:  */
9192                 SvREADONLY_off(dstr);
9193                 SvFAKE_off(dstr);
9194             }
9195         }
9196         else {
9197             /* Special case - not normally malloced for some reason */
9198             if ((SvREADONLY(sstr) && SvFAKE(sstr))) {
9199                 /* A "shared" PV - clone it as "shared" PV */
9200                 SvPV_set(dstr,
9201                          HEK_KEY(hek_dup(SvSHARED_HEK_FROM_PV(SvPVX_const(sstr)),
9202                                          param)));
9203             }
9204             else {
9205                 /* Some other special case - random pointer */
9206                 SvPV_set(dstr, SvPVX(sstr));            
9207             }
9208         }
9209     }
9210     else {
9211         /* Copy the Null */
9212         if (SvTYPE(dstr) == SVt_RV)
9213             SvRV_set(dstr, NULL);
9214         else
9215             SvPV_set(dstr, 0);
9216     }
9217 }
9218
9219 /* duplicate an SV of any type (including AV, HV etc) */
9220
9221 SV *
9222 Perl_sv_dup(pTHX_ SV *sstr, CLONE_PARAMS* param)
9223 {
9224     dVAR;
9225     SV *dstr;
9226
9227     if (!sstr || SvTYPE(sstr) == SVTYPEMASK)
9228         return Nullsv;
9229     /* look for it in the table first */
9230     dstr = (SV*)ptr_table_fetch(PL_ptr_table, sstr);
9231     if (dstr)
9232         return dstr;
9233
9234     if(param->flags & CLONEf_JOIN_IN) {
9235         /** We are joining here so we don't want do clone
9236             something that is bad **/
9237         const char *hvname;
9238
9239         if(SvTYPE(sstr) == SVt_PVHV &&
9240            (hvname = HvNAME_get(sstr))) {
9241             /** don't clone stashes if they already exist **/
9242             return (SV*)gv_stashpv(hvname,0);
9243         }
9244     }
9245
9246     /* create anew and remember what it is */
9247     new_SV(dstr);
9248
9249 #ifdef DEBUG_LEAKING_SCALARS
9250     dstr->sv_debug_optype = sstr->sv_debug_optype;
9251     dstr->sv_debug_line = sstr->sv_debug_line;
9252     dstr->sv_debug_inpad = sstr->sv_debug_inpad;
9253     dstr->sv_debug_cloned = 1;
9254 #  ifdef NETWARE
9255     dstr->sv_debug_file = savepv(sstr->sv_debug_file);
9256 #  else
9257     dstr->sv_debug_file = savesharedpv(sstr->sv_debug_file);
9258 #  endif
9259 #endif
9260
9261     ptr_table_store(PL_ptr_table, sstr, dstr);
9262
9263     /* clone */
9264     SvFLAGS(dstr)       = SvFLAGS(sstr);
9265     SvFLAGS(dstr)       &= ~SVf_OOK;            /* don't propagate OOK hack */
9266     SvREFCNT(dstr)      = 0;                    /* must be before any other dups! */
9267
9268 #ifdef DEBUGGING
9269     if (SvANY(sstr) && PL_watch_pvx && SvPVX_const(sstr) == PL_watch_pvx)
9270         PerlIO_printf(Perl_debug_log, "watch at %p hit, found string \"%s\"\n",
9271                       PL_watch_pvx, SvPVX_const(sstr));
9272 #endif
9273
9274     /* don't clone objects whose class has asked us not to */
9275     if (SvOBJECT(sstr) && ! (SvFLAGS(SvSTASH(sstr)) & SVphv_CLONEABLE)) {
9276         SvFLAGS(dstr) &= ~SVTYPEMASK;
9277         SvOBJECT_off(dstr);
9278         return dstr;
9279     }
9280
9281     switch (SvTYPE(sstr)) {
9282     case SVt_NULL:
9283         SvANY(dstr)     = NULL;
9284         break;
9285     case SVt_IV:
9286         SvANY(dstr)     = (XPVIV*)((char*)&(dstr->sv_u.svu_iv) - STRUCT_OFFSET(XPVIV, xiv_iv));
9287         SvIV_set(dstr, SvIVX(sstr));
9288         break;
9289     case SVt_NV:
9290         SvANY(dstr)     = new_XNV();
9291         SvNV_set(dstr, SvNVX(sstr));
9292         break;
9293     case SVt_RV:
9294         SvANY(dstr)     = &(dstr->sv_u.svu_rv);
9295         Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9296         break;
9297     default:
9298         {
9299             /* These are all the types that need complex bodies allocating.  */
9300             void *new_body;
9301             const svtype sv_type = SvTYPE(sstr);
9302             const struct body_details *const sv_type_details
9303                 = bodies_by_type + sv_type;
9304
9305             switch (sv_type) {
9306             default:
9307                 Perl_croak(aTHX_ "Bizarre SvTYPE [%" IVdf "]",
9308                            (IV)SvTYPE(sstr));
9309                 break;
9310
9311             case SVt_PVGV:
9312                 if (GvUNIQUE((GV*)sstr)) {
9313                     /* Do sharing here, and fall through */
9314                 }
9315             case SVt_PVIO:
9316             case SVt_PVFM:
9317             case SVt_PVHV:
9318             case SVt_PVAV:
9319             case SVt_PVBM:
9320             case SVt_PVCV:
9321             case SVt_PVLV:
9322             case SVt_PVMG:
9323             case SVt_PVNV:
9324             case SVt_PVIV:
9325             case SVt_PV:
9326                 assert(sv_type_details->copy);
9327                 if (sv_type_details->arena) {
9328                     new_body_inline(new_body, sv_type_details->copy, sv_type);
9329                     new_body
9330                         = (void*)((char*)new_body - sv_type_details->offset);
9331                 } else {
9332                     new_body = new_NOARENA(sv_type_details);
9333                 }
9334             }
9335             assert(new_body);
9336             SvANY(dstr) = new_body;
9337
9338 #ifndef PURIFY
9339             Copy(((char*)SvANY(sstr)) + sv_type_details->offset,
9340                  ((char*)SvANY(dstr)) + sv_type_details->offset,
9341                  sv_type_details->copy, char);
9342 #else
9343             Copy(((char*)SvANY(sstr)),
9344                  ((char*)SvANY(dstr)),
9345                  sv_type_details->size + sv_type_details->offset, char);
9346 #endif
9347
9348             if (sv_type != SVt_PVAV && sv_type != SVt_PVHV)
9349                 Perl_rvpv_dup(aTHX_ dstr, sstr, param);
9350
9351             /* The Copy above means that all the source (unduplicated) pointers
9352                are now in the destination.  We can check the flags and the
9353                pointers in either, but it's possible that there's less cache
9354                missing by always going for the destination.
9355                FIXME - instrument and check that assumption  */
9356             if (sv_type >= SVt_PVMG) {
9357                 if (SvMAGIC(dstr))
9358                     SvMAGIC_set(dstr, mg_dup(SvMAGIC(dstr), param));
9359                 if (SvSTASH(dstr))
9360                     SvSTASH_set(dstr, hv_dup_inc(SvSTASH(dstr), param));
9361             }
9362
9363             /* The cast silences a GCC warning about unhandled types.  */
9364             switch ((int)sv_type) {
9365             case SVt_PV:
9366                 break;
9367             case SVt_PVIV:
9368                 break;
9369             case SVt_PVNV:
9370                 break;
9371             case SVt_PVMG:
9372                 break;
9373             case SVt_PVBM:
9374                 break;
9375             case SVt_PVLV:
9376                 /* XXX LvTARGOFF sometimes holds PMOP* when DEBUGGING */
9377                 if (LvTYPE(dstr) == 't') /* for tie: unrefcnted fake (SV**) */
9378                     LvTARG(dstr) = dstr;
9379                 else if (LvTYPE(dstr) == 'T') /* for tie: fake HE */
9380                     LvTARG(dstr) = (SV*)he_dup((HE*)LvTARG(dstr), 0, param);
9381                 else
9382                     LvTARG(dstr) = sv_dup_inc(LvTARG(dstr), param);
9383                 break;
9384             case SVt_PVGV:
9385                 GvNAME(dstr)    = SAVEPVN(GvNAME(dstr), GvNAMELEN(dstr));
9386                 GvSTASH(dstr)   = hv_dup(GvSTASH(dstr), param);
9387                 /* Don't call sv_add_backref here as it's going to be created
9388                    as part of the magic cloning of the symbol table.  */
9389                 GvGP(dstr)      = gp_dup(GvGP(dstr), param);
9390                 (void)GpREFCNT_inc(GvGP(dstr));
9391                 break;
9392             case SVt_PVIO:
9393                 IoIFP(dstr)     = fp_dup(IoIFP(dstr), IoTYPE(dstr), param);
9394                 if (IoOFP(dstr) == IoIFP(sstr))
9395                     IoOFP(dstr) = IoIFP(dstr);
9396                 else
9397                     IoOFP(dstr) = fp_dup(IoOFP(dstr), IoTYPE(dstr), param);
9398                 /* PL_rsfp_filters entries have fake IoDIRP() */
9399                 if (IoDIRP(dstr) && !(IoFLAGS(dstr) & IOf_FAKE_DIRP))
9400                     IoDIRP(dstr)        = dirp_dup(IoDIRP(dstr));
9401                 if(IoFLAGS(dstr) & IOf_FAKE_DIRP) {
9402                     /* I have no idea why fake dirp (rsfps)
9403                        should be treated differently but otherwise
9404                        we end up with leaks -- sky*/
9405                     IoTOP_GV(dstr)      = gv_dup_inc(IoTOP_GV(dstr), param);
9406                     IoFMT_GV(dstr)      = gv_dup_inc(IoFMT_GV(dstr), param);
9407                     IoBOTTOM_GV(dstr)   = gv_dup_inc(IoBOTTOM_GV(dstr), param);
9408                 } else {
9409                     IoTOP_GV(dstr)      = gv_dup(IoTOP_GV(dstr), param);
9410                     IoFMT_GV(dstr)      = gv_dup(IoFMT_GV(dstr), param);
9411                     IoBOTTOM_GV(dstr)   = gv_dup(IoBOTTOM_GV(dstr), param);
9412                 }
9413                 IoTOP_NAME(dstr)        = SAVEPV(IoTOP_NAME(dstr));
9414                 IoFMT_NAME(dstr)        = SAVEPV(IoFMT_NAME(dstr));
9415                 IoBOTTOM_NAME(dstr)     = SAVEPV(IoBOTTOM_NAME(dstr));
9416                 break;
9417             case SVt_PVAV:
9418                 if (AvARRAY((AV*)sstr)) {
9419                     SV **dst_ary, **src_ary;
9420                     SSize_t items = AvFILLp((AV*)sstr) + 1;
9421
9422                     src_ary = AvARRAY((AV*)sstr);
9423                     Newxz(dst_ary, AvMAX((AV*)sstr)+1, SV*);
9424                     ptr_table_store(PL_ptr_table, src_ary, dst_ary);
9425                     SvPV_set(dstr, (char*)dst_ary);
9426                     AvALLOC((AV*)dstr) = dst_ary;
9427                     if (AvREAL((AV*)sstr)) {
9428                         while (items-- > 0)
9429                             *dst_ary++ = sv_dup_inc(*src_ary++, param);
9430                     }
9431                     else {
9432                         while (items-- > 0)
9433                             *dst_ary++ = sv_dup(*src_ary++, param);
9434                     }
9435                     items = AvMAX((AV*)sstr) - AvFILLp((AV*)sstr);
9436                     while (items-- > 0) {
9437                         *dst_ary++ = &PL_sv_undef;
9438                     }
9439                 }
9440                 else {
9441                     SvPV_set(dstr, Nullch);
9442                     AvALLOC((AV*)dstr)  = (SV**)NULL;
9443                 }
9444                 break;
9445             case SVt_PVHV:
9446                 {
9447                     HEK *hvname = 0;
9448
9449                     if (HvARRAY((HV*)sstr)) {
9450                         STRLEN i = 0;
9451                         const bool sharekeys = !!HvSHAREKEYS(sstr);
9452                         XPVHV * const dxhv = (XPVHV*)SvANY(dstr);
9453                         XPVHV * const sxhv = (XPVHV*)SvANY(sstr);
9454                         char *darray;
9455                         Newx(darray, PERL_HV_ARRAY_ALLOC_BYTES(dxhv->xhv_max+1)
9456                             + (SvOOK(sstr) ? sizeof(struct xpvhv_aux) : 0),
9457                             char);
9458                         HvARRAY(dstr) = (HE**)darray;
9459                         while (i <= sxhv->xhv_max) {
9460                             const HE *source = HvARRAY(sstr)[i];
9461                             HvARRAY(dstr)[i] = source
9462                                 ? he_dup(source, sharekeys, param) : 0;
9463                             ++i;
9464                         }
9465                         if (SvOOK(sstr)) {
9466                             struct xpvhv_aux *saux = HvAUX(sstr);
9467                             struct xpvhv_aux *daux = HvAUX(dstr);
9468                             /* This flag isn't copied.  */
9469                             /* SvOOK_on(hv) attacks the IV flags.  */
9470                             SvFLAGS(dstr) |= SVf_OOK;
9471
9472                             hvname = saux->xhv_name;
9473                             daux->xhv_name
9474                                 = hvname ? hek_dup(hvname, param) : hvname;
9475
9476                             daux->xhv_riter = saux->xhv_riter;
9477                             daux->xhv_eiter = saux->xhv_eiter
9478                                 ? he_dup(saux->xhv_eiter,
9479                                          (bool)!!HvSHAREKEYS(sstr), param) : 0;
9480                         }
9481                     }
9482                     else {
9483                         SvPV_set(dstr, Nullch);
9484                     }
9485                     /* Record stashes for possible cloning in Perl_clone(). */
9486                     if(hvname)
9487                         av_push(param->stashes, dstr);
9488                 }
9489                 break;
9490             case SVt_PVFM:
9491             case SVt_PVCV:
9492                 /* NOTE: not refcounted */
9493                 CvSTASH(dstr)   = hv_dup(CvSTASH(dstr), param);
9494                 OP_REFCNT_LOCK;
9495                 CvROOT(dstr)    = OpREFCNT_inc(CvROOT(dstr));
9496                 OP_REFCNT_UNLOCK;
9497                 if (CvCONST(dstr)) {
9498                     CvXSUBANY(dstr).any_ptr = GvUNIQUE(CvGV(dstr)) ?
9499                         SvREFCNT_inc(CvXSUBANY(dstr).any_ptr) :
9500                         sv_dup_inc((SV *)CvXSUBANY(dstr).any_ptr, param);
9501                 }
9502                 /* don't dup if copying back - CvGV isn't refcounted, so the
9503                  * duped GV may never be freed. A bit of a hack! DAPM */
9504                 CvGV(dstr)      = (param->flags & CLONEf_JOIN_IN) ?
9505                     Nullgv : gv_dup(CvGV(dstr), param) ;
9506                 if (!(param->flags & CLONEf_COPY_STACKS)) {
9507                     CvDEPTH(dstr) = 0;
9508                 }
9509                 PAD_DUP(CvPADLIST(dstr), CvPADLIST(sstr), param);
9510                 CvOUTSIDE(dstr) =
9511                     CvWEAKOUTSIDE(sstr)
9512                     ? cv_dup(    CvOUTSIDE(dstr), param)
9513                     : cv_dup_inc(CvOUTSIDE(dstr), param);
9514                 if (!CvXSUB(dstr))
9515                     CvFILE(dstr) = SAVEPV(CvFILE(dstr));
9516                 break;
9517             }
9518         }
9519     }
9520
9521     if (SvOBJECT(dstr) && SvTYPE(dstr) != SVt_PVIO)
9522         ++PL_sv_objcount;
9523
9524     return dstr;
9525  }
9526
9527 /* duplicate a context */
9528
9529 PERL_CONTEXT *
9530 Perl_cx_dup(pTHX_ PERL_CONTEXT *cxs, I32 ix, I32 max, CLONE_PARAMS* param)
9531 {
9532     PERL_CONTEXT *ncxs;
9533
9534     if (!cxs)
9535         return (PERL_CONTEXT*)NULL;
9536
9537     /* look for it in the table first */
9538     ncxs = (PERL_CONTEXT*)ptr_table_fetch(PL_ptr_table, cxs);
9539     if (ncxs)
9540         return ncxs;
9541
9542     /* create anew and remember what it is */
9543     Newxz(ncxs, max + 1, PERL_CONTEXT);
9544     ptr_table_store(PL_ptr_table, cxs, ncxs);
9545
9546     while (ix >= 0) {
9547         PERL_CONTEXT *cx = &cxs[ix];
9548         PERL_CONTEXT *ncx = &ncxs[ix];
9549         ncx->cx_type    = cx->cx_type;
9550         if (CxTYPE(cx) == CXt_SUBST) {
9551             Perl_croak(aTHX_ "Cloning substitution context is unimplemented");
9552         }
9553         else {
9554             ncx->blk_oldsp      = cx->blk_oldsp;
9555             ncx->blk_oldcop     = cx->blk_oldcop;
9556             ncx->blk_oldmarksp  = cx->blk_oldmarksp;
9557             ncx->blk_oldscopesp = cx->blk_oldscopesp;
9558             ncx->blk_oldpm      = cx->blk_oldpm;
9559             ncx->blk_gimme      = cx->blk_gimme;
9560             switch (CxTYPE(cx)) {
9561             case CXt_SUB:
9562                 ncx->blk_sub.cv         = (cx->blk_sub.olddepth == 0
9563                                            ? cv_dup_inc(cx->blk_sub.cv, param)
9564                                            : cv_dup(cx->blk_sub.cv,param));
9565                 ncx->blk_sub.argarray   = (cx->blk_sub.hasargs
9566                                            ? av_dup_inc(cx->blk_sub.argarray, param)
9567                                            : Nullav);
9568                 ncx->blk_sub.savearray  = av_dup_inc(cx->blk_sub.savearray, param);
9569                 ncx->blk_sub.olddepth   = cx->blk_sub.olddepth;
9570                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9571                 ncx->blk_sub.lval       = cx->blk_sub.lval;
9572                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9573                 break;
9574             case CXt_EVAL:
9575                 ncx->blk_eval.old_in_eval = cx->blk_eval.old_in_eval;
9576                 ncx->blk_eval.old_op_type = cx->blk_eval.old_op_type;
9577                 ncx->blk_eval.old_namesv = sv_dup_inc(cx->blk_eval.old_namesv, param);
9578                 ncx->blk_eval.old_eval_root = cx->blk_eval.old_eval_root;
9579                 ncx->blk_eval.cur_text  = sv_dup(cx->blk_eval.cur_text, param);
9580                 ncx->blk_eval.retop = cx->blk_eval.retop;
9581                 break;
9582             case CXt_LOOP:
9583                 ncx->blk_loop.label     = cx->blk_loop.label;
9584                 ncx->blk_loop.resetsp   = cx->blk_loop.resetsp;
9585                 ncx->blk_loop.redo_op   = cx->blk_loop.redo_op;
9586                 ncx->blk_loop.next_op   = cx->blk_loop.next_op;
9587                 ncx->blk_loop.last_op   = cx->blk_loop.last_op;
9588                 ncx->blk_loop.iterdata  = (CxPADLOOP(cx)
9589                                            ? cx->blk_loop.iterdata
9590                                            : gv_dup((GV*)cx->blk_loop.iterdata, param));
9591                 ncx->blk_loop.oldcomppad
9592                     = (PAD*)ptr_table_fetch(PL_ptr_table,
9593                                             cx->blk_loop.oldcomppad);
9594                 ncx->blk_loop.itersave  = sv_dup_inc(cx->blk_loop.itersave, param);
9595                 ncx->blk_loop.iterlval  = sv_dup_inc(cx->blk_loop.iterlval, param);
9596                 ncx->blk_loop.iterary   = av_dup_inc(cx->blk_loop.iterary, param);
9597                 ncx->blk_loop.iterix    = cx->blk_loop.iterix;
9598                 ncx->blk_loop.itermax   = cx->blk_loop.itermax;
9599                 break;
9600             case CXt_FORMAT:
9601                 ncx->blk_sub.cv         = cv_dup(cx->blk_sub.cv, param);
9602                 ncx->blk_sub.gv         = gv_dup(cx->blk_sub.gv, param);
9603                 ncx->blk_sub.dfoutgv    = gv_dup_inc(cx->blk_sub.dfoutgv, param);
9604                 ncx->blk_sub.hasargs    = cx->blk_sub.hasargs;
9605                 ncx->blk_sub.retop      = cx->blk_sub.retop;
9606                 break;
9607             case CXt_BLOCK:
9608             case CXt_NULL:
9609                 break;
9610             }
9611         }
9612         --ix;
9613     }
9614     return ncxs;
9615 }
9616
9617 /* duplicate a stack info structure */
9618
9619 PERL_SI *
9620 Perl_si_dup(pTHX_ PERL_SI *si, CLONE_PARAMS* param)
9621 {
9622     PERL_SI *nsi;
9623
9624     if (!si)
9625         return (PERL_SI*)NULL;
9626
9627     /* look for it in the table first */
9628     nsi = (PERL_SI*)ptr_table_fetch(PL_ptr_table, si);
9629     if (nsi)
9630         return nsi;
9631
9632     /* create anew and remember what it is */
9633     Newxz(nsi, 1, PERL_SI);
9634     ptr_table_store(PL_ptr_table, si, nsi);
9635
9636     nsi->si_stack       = av_dup_inc(si->si_stack, param);
9637     nsi->si_cxix        = si->si_cxix;
9638     nsi->si_cxmax       = si->si_cxmax;
9639     nsi->si_cxstack     = cx_dup(si->si_cxstack, si->si_cxix, si->si_cxmax, param);
9640     nsi->si_type        = si->si_type;
9641     nsi->si_prev        = si_dup(si->si_prev, param);
9642     nsi->si_next        = si_dup(si->si_next, param);
9643     nsi->si_markoff     = si->si_markoff;
9644
9645     return nsi;
9646 }
9647
9648 #define POPINT(ss,ix)   ((ss)[--(ix)].any_i32)
9649 #define TOPINT(ss,ix)   ((ss)[ix].any_i32)
9650 #define POPLONG(ss,ix)  ((ss)[--(ix)].any_long)
9651 #define TOPLONG(ss,ix)  ((ss)[ix].any_long)
9652 #define POPIV(ss,ix)    ((ss)[--(ix)].any_iv)
9653 #define TOPIV(ss,ix)    ((ss)[ix].any_iv)
9654 #define POPBOOL(ss,ix)  ((ss)[--(ix)].any_bool)
9655 #define TOPBOOL(ss,ix)  ((ss)[ix].any_bool)
9656 #define POPPTR(ss,ix)   ((ss)[--(ix)].any_ptr)
9657 #define TOPPTR(ss,ix)   ((ss)[ix].any_ptr)
9658 #define POPDPTR(ss,ix)  ((ss)[--(ix)].any_dptr)
9659 #define TOPDPTR(ss,ix)  ((ss)[ix].any_dptr)
9660 #define POPDXPTR(ss,ix) ((ss)[--(ix)].any_dxptr)
9661 #define TOPDXPTR(ss,ix) ((ss)[ix].any_dxptr)
9662
9663 /* XXXXX todo */
9664 #define pv_dup_inc(p)   SAVEPV(p)
9665 #define pv_dup(p)       SAVEPV(p)
9666 #define svp_dup_inc(p,pp)       any_dup(p,pp)
9667
9668 /* map any object to the new equivent - either something in the
9669  * ptr table, or something in the interpreter structure
9670  */
9671
9672 void *
9673 Perl_any_dup(pTHX_ void *v, const PerlInterpreter *proto_perl)
9674 {
9675     void *ret;
9676
9677     if (!v)
9678         return (void*)NULL;
9679
9680     /* look for it in the table first */
9681     ret = ptr_table_fetch(PL_ptr_table, v);
9682     if (ret)
9683         return ret;
9684
9685     /* see if it is part of the interpreter structure */
9686     if (v >= (void*)proto_perl && v < (void*)(proto_perl+1))
9687         ret = (void*)(((char*)aTHX) + (((char*)v) - (char*)proto_perl));
9688     else {
9689         ret = v;
9690     }
9691
9692     return ret;
9693 }
9694
9695 /* duplicate the save stack */
9696
9697 ANY *
9698 Perl_ss_dup(pTHX_ PerlInterpreter *proto_perl, CLONE_PARAMS* param)
9699 {
9700     ANY * const ss      = proto_perl->Tsavestack;
9701     const I32 max       = proto_perl->Tsavestack_max;
9702     I32 ix              = proto_perl->Tsavestack_ix;
9703     ANY *nss;
9704     SV *sv;
9705     GV *gv;
9706     AV *av;
9707     HV *hv;
9708     void* ptr;
9709     int intval;
9710     long longval;
9711     GP *gp;
9712     IV iv;
9713     char *c = NULL;
9714     void (*dptr) (void*);
9715     void (*dxptr) (pTHX_ void*);
9716
9717     Newxz(nss, max, ANY);
9718
9719     while (ix > 0) {
9720         I32 i = POPINT(ss,ix);
9721         TOPINT(nss,ix) = i;
9722         switch (i) {
9723         case SAVEt_ITEM:                        /* normal string */
9724             sv = (SV*)POPPTR(ss,ix);
9725             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9726             sv = (SV*)POPPTR(ss,ix);
9727             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9728             break;
9729         case SAVEt_SV:                          /* scalar reference */
9730             sv = (SV*)POPPTR(ss,ix);
9731             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9732             gv = (GV*)POPPTR(ss,ix);
9733             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9734             break;
9735         case SAVEt_GENERIC_PVREF:               /* generic char* */
9736             c = (char*)POPPTR(ss,ix);
9737             TOPPTR(nss,ix) = pv_dup(c);
9738             ptr = POPPTR(ss,ix);
9739             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9740             break;
9741         case SAVEt_SHARED_PVREF:                /* char* in shared space */
9742             c = (char*)POPPTR(ss,ix);
9743             TOPPTR(nss,ix) = savesharedpv(c);
9744             ptr = POPPTR(ss,ix);
9745             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9746             break;
9747         case SAVEt_GENERIC_SVREF:               /* generic sv */
9748         case SAVEt_SVREF:                       /* scalar reference */
9749             sv = (SV*)POPPTR(ss,ix);
9750             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9751             ptr = POPPTR(ss,ix);
9752             TOPPTR(nss,ix) = svp_dup_inc((SV**)ptr, proto_perl);/* XXXXX */
9753             break;
9754         case SAVEt_AV:                          /* array reference */
9755             av = (AV*)POPPTR(ss,ix);
9756             TOPPTR(nss,ix) = av_dup_inc(av, param);
9757             gv = (GV*)POPPTR(ss,ix);
9758             TOPPTR(nss,ix) = gv_dup(gv, param);
9759             break;
9760         case SAVEt_HV:                          /* hash reference */
9761             hv = (HV*)POPPTR(ss,ix);
9762             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9763             gv = (GV*)POPPTR(ss,ix);
9764             TOPPTR(nss,ix) = gv_dup(gv, param);
9765             break;
9766         case SAVEt_INT:                         /* int reference */
9767             ptr = POPPTR(ss,ix);
9768             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9769             intval = (int)POPINT(ss,ix);
9770             TOPINT(nss,ix) = intval;
9771             break;
9772         case SAVEt_LONG:                        /* long reference */
9773             ptr = POPPTR(ss,ix);
9774             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9775             longval = (long)POPLONG(ss,ix);
9776             TOPLONG(nss,ix) = longval;
9777             break;
9778         case SAVEt_I32:                         /* I32 reference */
9779         case SAVEt_I16:                         /* I16 reference */
9780         case SAVEt_I8:                          /* I8 reference */
9781             ptr = POPPTR(ss,ix);
9782             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9783             i = POPINT(ss,ix);
9784             TOPINT(nss,ix) = i;
9785             break;
9786         case SAVEt_IV:                          /* IV reference */
9787             ptr = POPPTR(ss,ix);
9788             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9789             iv = POPIV(ss,ix);
9790             TOPIV(nss,ix) = iv;
9791             break;
9792         case SAVEt_SPTR:                        /* SV* reference */
9793             ptr = POPPTR(ss,ix);
9794             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9795             sv = (SV*)POPPTR(ss,ix);
9796             TOPPTR(nss,ix) = sv_dup(sv, param);
9797             break;
9798         case SAVEt_VPTR:                        /* random* reference */
9799             ptr = POPPTR(ss,ix);
9800             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9801             ptr = POPPTR(ss,ix);
9802             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9803             break;
9804         case SAVEt_PPTR:                        /* char* reference */
9805             ptr = POPPTR(ss,ix);
9806             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9807             c = (char*)POPPTR(ss,ix);
9808             TOPPTR(nss,ix) = pv_dup(c);
9809             break;
9810         case SAVEt_HPTR:                        /* HV* reference */
9811             ptr = POPPTR(ss,ix);
9812             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9813             hv = (HV*)POPPTR(ss,ix);
9814             TOPPTR(nss,ix) = hv_dup(hv, param);
9815             break;
9816         case SAVEt_APTR:                        /* AV* reference */
9817             ptr = POPPTR(ss,ix);
9818             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9819             av = (AV*)POPPTR(ss,ix);
9820             TOPPTR(nss,ix) = av_dup(av, param);
9821             break;
9822         case SAVEt_NSTAB:
9823             gv = (GV*)POPPTR(ss,ix);
9824             TOPPTR(nss,ix) = gv_dup(gv, param);
9825             break;
9826         case SAVEt_GP:                          /* scalar reference */
9827             gp = (GP*)POPPTR(ss,ix);
9828             TOPPTR(nss,ix) = gp = gp_dup(gp, param);
9829             (void)GpREFCNT_inc(gp);
9830             gv = (GV*)POPPTR(ss,ix);
9831             TOPPTR(nss,ix) = gv_dup_inc(gv, param);
9832             c = (char*)POPPTR(ss,ix);
9833             TOPPTR(nss,ix) = pv_dup(c);
9834             iv = POPIV(ss,ix);
9835             TOPIV(nss,ix) = iv;
9836             iv = POPIV(ss,ix);
9837             TOPIV(nss,ix) = iv;
9838             break;
9839         case SAVEt_FREESV:
9840         case SAVEt_MORTALIZESV:
9841             sv = (SV*)POPPTR(ss,ix);
9842             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9843             break;
9844         case SAVEt_FREEOP:
9845             ptr = POPPTR(ss,ix);
9846             if (ptr && (((OP*)ptr)->op_private & OPpREFCOUNTED)) {
9847                 /* these are assumed to be refcounted properly */
9848                 OP *o;
9849                 switch (((OP*)ptr)->op_type) {
9850                 case OP_LEAVESUB:
9851                 case OP_LEAVESUBLV:
9852                 case OP_LEAVEEVAL:
9853                 case OP_LEAVE:
9854                 case OP_SCOPE:
9855                 case OP_LEAVEWRITE:
9856                     TOPPTR(nss,ix) = ptr;
9857                     o = (OP*)ptr;
9858                     OpREFCNT_inc(o);
9859                     break;
9860                 default:
9861                     TOPPTR(nss,ix) = Nullop;
9862                     break;
9863                 }
9864             }
9865             else
9866                 TOPPTR(nss,ix) = Nullop;
9867             break;
9868         case SAVEt_FREEPV:
9869             c = (char*)POPPTR(ss,ix);
9870             TOPPTR(nss,ix) = pv_dup_inc(c);
9871             break;
9872         case SAVEt_CLEARSV:
9873             longval = POPLONG(ss,ix);
9874             TOPLONG(nss,ix) = longval;
9875             break;
9876         case SAVEt_DELETE:
9877             hv = (HV*)POPPTR(ss,ix);
9878             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9879             c = (char*)POPPTR(ss,ix);
9880             TOPPTR(nss,ix) = pv_dup_inc(c);
9881             i = POPINT(ss,ix);
9882             TOPINT(nss,ix) = i;
9883             break;
9884         case SAVEt_DESTRUCTOR:
9885             ptr = POPPTR(ss,ix);
9886             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9887             dptr = POPDPTR(ss,ix);
9888             TOPDPTR(nss,ix) = DPTR2FPTR(void (*)(void*),
9889                                         any_dup(FPTR2DPTR(void *, dptr),
9890                                                 proto_perl));
9891             break;
9892         case SAVEt_DESTRUCTOR_X:
9893             ptr = POPPTR(ss,ix);
9894             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);  /* XXX quite arbitrary */
9895             dxptr = POPDXPTR(ss,ix);
9896             TOPDXPTR(nss,ix) = DPTR2FPTR(void (*)(pTHX_ void*),
9897                                          any_dup(FPTR2DPTR(void *, dxptr),
9898                                                  proto_perl));
9899             break;
9900         case SAVEt_REGCONTEXT:
9901         case SAVEt_ALLOC:
9902             i = POPINT(ss,ix);
9903             TOPINT(nss,ix) = i;
9904             ix -= i;
9905             break;
9906         case SAVEt_STACK_POS:           /* Position on Perl stack */
9907             i = POPINT(ss,ix);
9908             TOPINT(nss,ix) = i;
9909             break;
9910         case SAVEt_AELEM:               /* array element */
9911             sv = (SV*)POPPTR(ss,ix);
9912             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9913             i = POPINT(ss,ix);
9914             TOPINT(nss,ix) = i;
9915             av = (AV*)POPPTR(ss,ix);
9916             TOPPTR(nss,ix) = av_dup_inc(av, param);
9917             break;
9918         case SAVEt_HELEM:               /* hash element */
9919             sv = (SV*)POPPTR(ss,ix);
9920             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9921             sv = (SV*)POPPTR(ss,ix);
9922             TOPPTR(nss,ix) = sv_dup_inc(sv, param);
9923             hv = (HV*)POPPTR(ss,ix);
9924             TOPPTR(nss,ix) = hv_dup_inc(hv, param);
9925             break;
9926         case SAVEt_OP:
9927             ptr = POPPTR(ss,ix);
9928             TOPPTR(nss,ix) = ptr;
9929             break;
9930         case SAVEt_HINTS:
9931             i = POPINT(ss,ix);
9932             TOPINT(nss,ix) = i;
9933             break;
9934         case SAVEt_COMPPAD:
9935             av = (AV*)POPPTR(ss,ix);
9936             TOPPTR(nss,ix) = av_dup(av, param);
9937             break;
9938         case SAVEt_PADSV:
9939             longval = (long)POPLONG(ss,ix);
9940             TOPLONG(nss,ix) = longval;
9941             ptr = POPPTR(ss,ix);
9942             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9943             sv = (SV*)POPPTR(ss,ix);
9944             TOPPTR(nss,ix) = sv_dup(sv, param);
9945             break;
9946         case SAVEt_BOOL:
9947             ptr = POPPTR(ss,ix);
9948             TOPPTR(nss,ix) = any_dup(ptr, proto_perl);
9949             longval = (long)POPBOOL(ss,ix);
9950             TOPBOOL(nss,ix) = (bool)longval;
9951             break;
9952         case SAVEt_SET_SVFLAGS:
9953             i = POPINT(ss,ix);
9954             TOPINT(nss,ix) = i;
9955             i = POPINT(ss,ix);
9956             TOPINT(nss,ix) = i;
9957             sv = (SV*)POPPTR(ss,ix);
9958             TOPPTR(nss,ix) = sv_dup(sv, param);
9959             break;
9960         default:
9961             Perl_croak(aTHX_ "panic: ss_dup inconsistency");
9962         }
9963     }
9964
9965     return nss;
9966 }
9967
9968
9969 /* if sv is a stash, call $class->CLONE_SKIP(), and set the SVphv_CLONEABLE
9970  * flag to the result. This is done for each stash before cloning starts,
9971  * so we know which stashes want their objects cloned */
9972
9973 static void
9974 do_mark_cloneable_stash(pTHX_ SV *sv)
9975 {
9976     const HEK * const hvname = HvNAME_HEK((HV*)sv);
9977     if (hvname) {
9978         GV* const cloner = gv_fetchmethod_autoload((HV*)sv, "CLONE_SKIP", 0);
9979         SvFLAGS(sv) |= SVphv_CLONEABLE; /* clone objects by default */
9980         if (cloner && GvCV(cloner)) {
9981             dSP;
9982             UV status;
9983
9984             ENTER;
9985             SAVETMPS;
9986             PUSHMARK(SP);
9987             XPUSHs(sv_2mortal(newSVhek(hvname)));
9988             PUTBACK;
9989             call_sv((SV*)GvCV(cloner), G_SCALAR);
9990             SPAGAIN;
9991             status = POPu;
9992             PUTBACK;
9993             FREETMPS;
9994             LEAVE;
9995             if (status)
9996                 SvFLAGS(sv) &= ~SVphv_CLONEABLE;
9997         }
9998     }
9999 }
10000
10001
10002
10003 /*
10004 =for apidoc perl_clone
10005
10006 Create and return a new interpreter by cloning the current one.
10007
10008 perl_clone takes these flags as parameters:
10009
10010 CLONEf_COPY_STACKS - is used to, well, copy the stacks also,
10011 without it we only clone the data and zero the stacks,
10012 with it we copy the stacks and the new perl interpreter is
10013 ready to run at the exact same point as the previous one.
10014 The pseudo-fork code uses COPY_STACKS while the
10015 threads->new doesn't.
10016
10017 CLONEf_KEEP_PTR_TABLE
10018 perl_clone keeps a ptr_table with the pointer of the old
10019 variable as a key and the new variable as a value,
10020 this allows it to check if something has been cloned and not
10021 clone it again but rather just use the value and increase the
10022 refcount. If KEEP_PTR_TABLE is not set then perl_clone will kill
10023 the ptr_table using the function
10024 C<ptr_table_free(PL_ptr_table); PL_ptr_table = NULL;>,
10025 reason to keep it around is if you want to dup some of your own
10026 variable who are outside the graph perl scans, example of this
10027 code is in threads.xs create
10028
10029 CLONEf_CLONE_HOST
10030 This is a win32 thing, it is ignored on unix, it tells perls
10031 win32host code (which is c++) to clone itself, this is needed on
10032 win32 if you want to run two threads at the same time,
10033 if you just want to do some stuff in a separate perl interpreter
10034 and then throw it away and return to the original one,
10035 you don't need to do anything.
10036
10037 =cut
10038 */
10039
10040 /* XXX the above needs expanding by someone who actually understands it ! */
10041 EXTERN_C PerlInterpreter *
10042 perl_clone_host(PerlInterpreter* proto_perl, UV flags);
10043
10044 PerlInterpreter *
10045 perl_clone(PerlInterpreter *proto_perl, UV flags)
10046 {
10047    dVAR;
10048 #ifdef PERL_IMPLICIT_SYS
10049
10050    /* perlhost.h so we need to call into it
10051    to clone the host, CPerlHost should have a c interface, sky */
10052
10053    if (flags & CLONEf_CLONE_HOST) {
10054        return perl_clone_host(proto_perl,flags);
10055    }
10056    return perl_clone_using(proto_perl, flags,
10057                             proto_perl->IMem,
10058                             proto_perl->IMemShared,
10059                             proto_perl->IMemParse,
10060                             proto_perl->IEnv,
10061                             proto_perl->IStdIO,
10062                             proto_perl->ILIO,
10063                             proto_perl->IDir,
10064                             proto_perl->ISock,
10065                             proto_perl->IProc);
10066 }
10067
10068 PerlInterpreter *
10069 perl_clone_using(PerlInterpreter *proto_perl, UV flags,
10070                  struct IPerlMem* ipM, struct IPerlMem* ipMS,
10071                  struct IPerlMem* ipMP, struct IPerlEnv* ipE,
10072                  struct IPerlStdIO* ipStd, struct IPerlLIO* ipLIO,
10073                  struct IPerlDir* ipD, struct IPerlSock* ipS,
10074                  struct IPerlProc* ipP)
10075 {
10076     /* XXX many of the string copies here can be optimized if they're
10077      * constants; they need to be allocated as common memory and just
10078      * their pointers copied. */
10079
10080     IV i;
10081     CLONE_PARAMS clone_params;
10082     CLONE_PARAMS* param = &clone_params;
10083
10084     PerlInterpreter *my_perl = (PerlInterpreter*)(*ipM->pMalloc)(ipM, sizeof(PerlInterpreter));
10085     /* for each stash, determine whether its objects should be cloned */
10086     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10087     PERL_SET_THX(my_perl);
10088
10089 #  ifdef DEBUGGING
10090     Poison(my_perl, 1, PerlInterpreter);
10091     PL_op = Nullop;
10092     PL_curcop = (COP *)Nullop;
10093     PL_markstack = 0;
10094     PL_scopestack = 0;
10095     PL_savestack = 0;
10096     PL_savestack_ix = 0;
10097     PL_savestack_max = -1;
10098     PL_sig_pending = 0;
10099     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10100 #  else /* !DEBUGGING */
10101     Zero(my_perl, 1, PerlInterpreter);
10102 #  endif        /* DEBUGGING */
10103
10104     /* host pointers */
10105     PL_Mem              = ipM;
10106     PL_MemShared        = ipMS;
10107     PL_MemParse         = ipMP;
10108     PL_Env              = ipE;
10109     PL_StdIO            = ipStd;
10110     PL_LIO              = ipLIO;
10111     PL_Dir              = ipD;
10112     PL_Sock             = ipS;
10113     PL_Proc             = ipP;
10114 #else           /* !PERL_IMPLICIT_SYS */
10115     IV i;
10116     CLONE_PARAMS clone_params;
10117     CLONE_PARAMS* param = &clone_params;
10118     PerlInterpreter *my_perl = (PerlInterpreter*)PerlMem_malloc(sizeof(PerlInterpreter));
10119     /* for each stash, determine whether its objects should be cloned */
10120     S_visit(proto_perl, do_mark_cloneable_stash, SVt_PVHV, SVTYPEMASK);
10121     PERL_SET_THX(my_perl);
10122
10123 #    ifdef DEBUGGING
10124     Poison(my_perl, 1, PerlInterpreter);
10125     PL_op = Nullop;
10126     PL_curcop = (COP *)Nullop;
10127     PL_markstack = 0;
10128     PL_scopestack = 0;
10129     PL_savestack = 0;
10130     PL_savestack_ix = 0;
10131     PL_savestack_max = -1;
10132     PL_sig_pending = 0;
10133     Zero(&PL_debug_pad, 1, struct perl_debug_pad);
10134 #    else       /* !DEBUGGING */
10135     Zero(my_perl, 1, PerlInterpreter);
10136 #    endif      /* DEBUGGING */
10137 #endif          /* PERL_IMPLICIT_SYS */
10138     param->flags = flags;
10139     param->proto_perl = proto_perl;
10140
10141     Zero(&PL_body_arenaroots, 1, PL_body_arenaroots);
10142     Zero(&PL_body_roots, 1, PL_body_roots);
10143     
10144     PL_nice_chunk       = NULL;
10145     PL_nice_chunk_size  = 0;
10146     PL_sv_count         = 0;
10147     PL_sv_objcount      = 0;
10148     PL_sv_root          = Nullsv;
10149     PL_sv_arenaroot     = Nullsv;
10150
10151     PL_debug            = proto_perl->Idebug;
10152
10153     PL_hash_seed        = proto_perl->Ihash_seed;
10154     PL_rehash_seed      = proto_perl->Irehash_seed;
10155
10156 #ifdef USE_REENTRANT_API
10157     /* XXX: things like -Dm will segfault here in perlio, but doing
10158      *  PERL_SET_CONTEXT(proto_perl);
10159      * breaks too many other things
10160      */
10161     Perl_reentrant_init(aTHX);
10162 #endif
10163
10164     /* create SV map for pointer relocation */
10165     PL_ptr_table = ptr_table_new();
10166
10167     /* initialize these special pointers as early as possible */
10168     SvANY(&PL_sv_undef)         = NULL;
10169     SvREFCNT(&PL_sv_undef)      = (~(U32)0)/2;
10170     SvFLAGS(&PL_sv_undef)       = SVf_READONLY|SVt_NULL;
10171     ptr_table_store(PL_ptr_table, &proto_perl->Isv_undef, &PL_sv_undef);
10172
10173     SvANY(&PL_sv_no)            = new_XPVNV();
10174     SvREFCNT(&PL_sv_no)         = (~(U32)0)/2;
10175     SvFLAGS(&PL_sv_no)          = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10176                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10177     SvPV_set(&PL_sv_no, SAVEPVN(PL_No, 0));
10178     SvCUR_set(&PL_sv_no, 0);
10179     SvLEN_set(&PL_sv_no, 1);
10180     SvIV_set(&PL_sv_no, 0);
10181     SvNV_set(&PL_sv_no, 0);
10182     ptr_table_store(PL_ptr_table, &proto_perl->Isv_no, &PL_sv_no);
10183
10184     SvANY(&PL_sv_yes)           = new_XPVNV();
10185     SvREFCNT(&PL_sv_yes)        = (~(U32)0)/2;
10186     SvFLAGS(&PL_sv_yes)         = SVp_IOK|SVf_IOK|SVp_NOK|SVf_NOK
10187                                   |SVp_POK|SVf_POK|SVf_READONLY|SVt_PVNV;
10188     SvPV_set(&PL_sv_yes, SAVEPVN(PL_Yes, 1));
10189     SvCUR_set(&PL_sv_yes, 1);
10190     SvLEN_set(&PL_sv_yes, 2);
10191     SvIV_set(&PL_sv_yes, 1);
10192     SvNV_set(&PL_sv_yes, 1);
10193     ptr_table_store(PL_ptr_table, &proto_perl->Isv_yes, &PL_sv_yes);
10194
10195     /* create (a non-shared!) shared string table */
10196     PL_strtab           = newHV();
10197     HvSHAREKEYS_off(PL_strtab);
10198     hv_ksplit(PL_strtab, HvTOTALKEYS(proto_perl->Istrtab));
10199     ptr_table_store(PL_ptr_table, proto_perl->Istrtab, PL_strtab);
10200
10201     PL_compiling = proto_perl->Icompiling;
10202
10203     /* These two PVs will be free'd special way so must set them same way op.c does */
10204     PL_compiling.cop_stashpv = savesharedpv(PL_compiling.cop_stashpv);
10205     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_stashpv, PL_compiling.cop_stashpv);
10206
10207     PL_compiling.cop_file    = savesharedpv(PL_compiling.cop_file);
10208     ptr_table_store(PL_ptr_table, proto_perl->Icompiling.cop_file, PL_compiling.cop_file);
10209
10210     ptr_table_store(PL_ptr_table, &proto_perl->Icompiling, &PL_compiling);
10211     if (!specialWARN(PL_compiling.cop_warnings))
10212         PL_compiling.cop_warnings = sv_dup_inc(PL_compiling.cop_warnings, param);
10213     if (!specialCopIO(PL_compiling.cop_io))
10214         PL_compiling.cop_io = sv_dup_inc(PL_compiling.cop_io, param);
10215     PL_curcop           = (COP*)any_dup(proto_perl->Tcurcop, proto_perl);
10216
10217     /* pseudo environmental stuff */
10218     PL_origargc         = proto_perl->Iorigargc;
10219     PL_origargv         = proto_perl->Iorigargv;
10220
10221     param->stashes      = newAV();  /* Setup array of objects to call clone on */
10222
10223     /* Set tainting stuff before PerlIO_debug can possibly get called */
10224     PL_tainting         = proto_perl->Itainting;
10225     PL_taint_warn       = proto_perl->Itaint_warn;
10226
10227 #ifdef PERLIO_LAYERS
10228     /* Clone PerlIO tables as soon as we can handle general xx_dup() */
10229     PerlIO_clone(aTHX_ proto_perl, param);
10230 #endif
10231
10232     PL_envgv            = gv_dup(proto_perl->Ienvgv, param);
10233     PL_incgv            = gv_dup(proto_perl->Iincgv, param);
10234     PL_hintgv           = gv_dup(proto_perl->Ihintgv, param);
10235     PL_origfilename     = SAVEPV(proto_perl->Iorigfilename);
10236     PL_diehook          = sv_dup_inc(proto_perl->Idiehook, param);
10237     PL_warnhook         = sv_dup_inc(proto_perl->Iwarnhook, param);
10238
10239     /* switches */
10240     PL_minus_c          = proto_perl->Iminus_c;
10241     PL_patchlevel       = sv_dup_inc(proto_perl->Ipatchlevel, param);
10242     PL_localpatches     = proto_perl->Ilocalpatches;
10243     PL_splitstr         = proto_perl->Isplitstr;
10244     PL_preprocess       = proto_perl->Ipreprocess;
10245     PL_minus_n          = proto_perl->Iminus_n;
10246     PL_minus_p          = proto_perl->Iminus_p;
10247     PL_minus_l          = proto_perl->Iminus_l;
10248     PL_minus_a          = proto_perl->Iminus_a;
10249     PL_minus_F          = proto_perl->Iminus_F;
10250     PL_doswitches       = proto_perl->Idoswitches;
10251     PL_dowarn           = proto_perl->Idowarn;
10252     PL_doextract        = proto_perl->Idoextract;
10253     PL_sawampersand     = proto_perl->Isawampersand;
10254     PL_unsafe           = proto_perl->Iunsafe;
10255     PL_inplace          = SAVEPV(proto_perl->Iinplace);
10256     PL_e_script         = sv_dup_inc(proto_perl->Ie_script, param);
10257     PL_perldb           = proto_perl->Iperldb;
10258     PL_perl_destruct_level = proto_perl->Iperl_destruct_level;
10259     PL_exit_flags       = proto_perl->Iexit_flags;
10260
10261     /* magical thingies */
10262     /* XXX time(&PL_basetime) when asked for? */
10263     PL_basetime         = proto_perl->Ibasetime;
10264     PL_formfeed         = sv_dup(proto_perl->Iformfeed, param);
10265
10266     PL_maxsysfd         = proto_perl->Imaxsysfd;
10267     PL_multiline        = proto_perl->Imultiline;
10268     PL_statusvalue      = proto_perl->Istatusvalue;
10269 #ifdef VMS
10270     PL_statusvalue_vms  = proto_perl->Istatusvalue_vms;
10271 #else
10272     PL_statusvalue_posix = proto_perl->Istatusvalue_posix;
10273 #endif
10274     PL_encoding         = sv_dup(proto_perl->Iencoding, param);
10275
10276     sv_setpvn(PERL_DEBUG_PAD(0), "", 0);        /* For regex debugging. */
10277     sv_setpvn(PERL_DEBUG_PAD(1), "", 0);        /* ext/re needs these */
10278     sv_setpvn(PERL_DEBUG_PAD(2), "", 0);        /* even without DEBUGGING. */
10279
10280     /* Clone the regex array */
10281     PL_regex_padav = newAV();
10282     {
10283         const I32 len = av_len((AV*)proto_perl->Iregex_padav);
10284         SV** const regexen = AvARRAY((AV*)proto_perl->Iregex_padav);
10285         IV i;
10286         av_push(PL_regex_padav,
10287                 sv_dup_inc(regexen[0],param));
10288         for(i = 1; i <= len; i++) {
10289             if(SvREPADTMP(regexen[i])) {
10290               av_push(PL_regex_padav, sv_dup_inc(regexen[i], param));
10291             } else {
10292                 av_push(PL_regex_padav,
10293                     SvREFCNT_inc(
10294                         newSViv(PTR2IV(re_dup(INT2PTR(REGEXP *,
10295                              SvIVX(regexen[i])), param)))
10296                        ));
10297             }
10298         }
10299     }
10300     PL_regex_pad = AvARRAY(PL_regex_padav);
10301
10302     /* shortcuts to various I/O objects */
10303     PL_stdingv          = gv_dup(proto_perl->Istdingv, param);
10304     PL_stderrgv         = gv_dup(proto_perl->Istderrgv, param);
10305     PL_defgv            = gv_dup(proto_perl->Idefgv, param);
10306     PL_argvgv           = gv_dup(proto_perl->Iargvgv, param);
10307     PL_argvoutgv        = gv_dup(proto_perl->Iargvoutgv, param);
10308     PL_argvout_stack    = av_dup_inc(proto_perl->Iargvout_stack, param);
10309
10310     /* shortcuts to regexp stuff */
10311     PL_replgv           = gv_dup(proto_perl->Ireplgv, param);
10312
10313     /* shortcuts to misc objects */
10314     PL_errgv            = gv_dup(proto_perl->Ierrgv, param);
10315
10316     /* shortcuts to debugging objects */
10317     PL_DBgv             = gv_dup(proto_perl->IDBgv, param);
10318     PL_DBline           = gv_dup(proto_perl->IDBline, param);
10319     PL_DBsub            = gv_dup(proto_perl->IDBsub, param);
10320     PL_DBsingle         = sv_dup(proto_perl->IDBsingle, param);
10321     PL_DBtrace          = sv_dup(proto_perl->IDBtrace, param);
10322     PL_DBsignal         = sv_dup(proto_perl->IDBsignal, param);
10323     PL_DBassertion      = sv_dup(proto_perl->IDBassertion, param);
10324     PL_lineary          = av_dup(proto_perl->Ilineary, param);
10325     PL_dbargs           = av_dup(proto_perl->Idbargs, param);
10326
10327     /* symbol tables */
10328     PL_defstash         = hv_dup_inc(proto_perl->Tdefstash, param);
10329     PL_curstash         = hv_dup(proto_perl->Tcurstash, param);
10330     PL_debstash         = hv_dup(proto_perl->Idebstash, param);
10331     PL_globalstash      = hv_dup(proto_perl->Iglobalstash, param);
10332     PL_curstname        = sv_dup_inc(proto_perl->Icurstname, param);
10333
10334     PL_beginav          = av_dup_inc(proto_perl->Ibeginav, param);
10335     PL_beginav_save     = av_dup_inc(proto_perl->Ibeginav_save, param);
10336     PL_checkav_save     = av_dup_inc(proto_perl->Icheckav_save, param);
10337     PL_endav            = av_dup_inc(proto_perl->Iendav, param);
10338     PL_checkav          = av_dup_inc(proto_perl->Icheckav, param);
10339     PL_initav           = av_dup_inc(proto_perl->Iinitav, param);
10340
10341     PL_sub_generation   = proto_perl->Isub_generation;
10342
10343     /* funky return mechanisms */
10344     PL_forkprocess      = proto_perl->Iforkprocess;
10345
10346     /* subprocess state */
10347     PL_fdpid            = av_dup_inc(proto_perl->Ifdpid, param);
10348
10349     /* internal state */
10350     PL_maxo             = proto_perl->Imaxo;
10351     if (proto_perl->Iop_mask)
10352         PL_op_mask      = SAVEPVN(proto_perl->Iop_mask, PL_maxo);
10353     else
10354         PL_op_mask      = Nullch;
10355     /* PL_asserting        = proto_perl->Iasserting; */
10356
10357     /* current interpreter roots */
10358     PL_main_cv          = cv_dup_inc(proto_perl->Imain_cv, param);
10359     PL_main_root        = OpREFCNT_inc(proto_perl->Imain_root);
10360     PL_main_start       = proto_perl->Imain_start;
10361     PL_eval_root        = proto_perl->Ieval_root;
10362     PL_eval_start       = proto_perl->Ieval_start;
10363
10364     /* runtime control stuff */
10365     PL_curcopdb         = (COP*)any_dup(proto_perl->Icurcopdb, proto_perl);
10366     PL_copline          = proto_perl->Icopline;
10367
10368     PL_filemode         = proto_perl->Ifilemode;
10369     PL_lastfd           = proto_perl->Ilastfd;
10370     PL_oldname          = proto_perl->Ioldname;         /* XXX not quite right */
10371     PL_Argv             = NULL;
10372     PL_Cmd              = Nullch;
10373     PL_gensym           = proto_perl->Igensym;
10374     PL_preambled        = proto_perl->Ipreambled;
10375     PL_preambleav       = av_dup_inc(proto_perl->Ipreambleav, param);
10376     PL_laststatval      = proto_perl->Ilaststatval;
10377     PL_laststype        = proto_perl->Ilaststype;
10378     PL_mess_sv          = Nullsv;
10379
10380     PL_ors_sv           = sv_dup_inc(proto_perl->Iors_sv, param);
10381
10382     /* interpreter atexit processing */
10383     PL_exitlistlen      = proto_perl->Iexitlistlen;
10384     if (PL_exitlistlen) {
10385         Newx(PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10386         Copy(proto_perl->Iexitlist, PL_exitlist, PL_exitlistlen, PerlExitListEntry);
10387     }
10388     else
10389         PL_exitlist     = (PerlExitListEntry*)NULL;
10390     PL_modglobal        = hv_dup_inc(proto_perl->Imodglobal, param);
10391     PL_custom_op_names  = hv_dup_inc(proto_perl->Icustom_op_names,param);
10392     PL_custom_op_descs  = hv_dup_inc(proto_perl->Icustom_op_descs,param);
10393
10394     PL_profiledata      = NULL;
10395     PL_rsfp             = fp_dup(proto_perl->Irsfp, '<', param);
10396     /* PL_rsfp_filters entries have fake IoDIRP() */
10397     PL_rsfp_filters     = av_dup_inc(proto_perl->Irsfp_filters, param);
10398
10399     PL_compcv                   = cv_dup(proto_perl->Icompcv, param);
10400
10401     PAD_CLONE_VARS(proto_perl, param);
10402
10403 #ifdef HAVE_INTERP_INTERN
10404     sys_intern_dup(&proto_perl->Isys_intern, &PL_sys_intern);
10405 #endif
10406
10407     /* more statics moved here */
10408     PL_generation       = proto_perl->Igeneration;
10409     PL_DBcv             = cv_dup(proto_perl->IDBcv, param);
10410
10411     PL_in_clean_objs    = proto_perl->Iin_clean_objs;
10412     PL_in_clean_all     = proto_perl->Iin_clean_all;
10413
10414     PL_uid              = proto_perl->Iuid;
10415     PL_euid             = proto_perl->Ieuid;
10416     PL_gid              = proto_perl->Igid;
10417     PL_egid             = proto_perl->Iegid;
10418     PL_nomemok          = proto_perl->Inomemok;
10419     PL_an               = proto_perl->Ian;
10420     PL_evalseq          = proto_perl->Ievalseq;
10421     PL_origenviron      = proto_perl->Iorigenviron;     /* XXX not quite right */
10422     PL_origalen         = proto_perl->Iorigalen;
10423 #ifdef PERL_USES_PL_PIDSTATUS
10424     PL_pidstatus        = newHV();                      /* XXX flag for cloning? */
10425 #endif
10426     PL_osname           = SAVEPV(proto_perl->Iosname);
10427     PL_sighandlerp      = proto_perl->Isighandlerp;
10428
10429     PL_runops           = proto_perl->Irunops;
10430
10431     Copy(proto_perl->Itokenbuf, PL_tokenbuf, 256, char);
10432
10433 #ifdef CSH
10434     PL_cshlen           = proto_perl->Icshlen;
10435     PL_cshname          = proto_perl->Icshname; /* XXX never deallocated */
10436 #endif
10437
10438     PL_lex_state        = proto_perl->Ilex_state;
10439     PL_lex_defer        = proto_perl->Ilex_defer;
10440     PL_lex_expect       = proto_perl->Ilex_expect;
10441     PL_lex_formbrack    = proto_perl->Ilex_formbrack;
10442     PL_lex_dojoin       = proto_perl->Ilex_dojoin;
10443     PL_lex_starts       = proto_perl->Ilex_starts;
10444     PL_lex_stuff        = sv_dup_inc(proto_perl->Ilex_stuff, param);
10445     PL_lex_repl         = sv_dup_inc(proto_perl->Ilex_repl, param);
10446     PL_lex_op           = proto_perl->Ilex_op;
10447     PL_lex_inpat        = proto_perl->Ilex_inpat;
10448     PL_lex_inwhat       = proto_perl->Ilex_inwhat;
10449     PL_lex_brackets     = proto_perl->Ilex_brackets;
10450     i = (PL_lex_brackets < 120 ? 120 : PL_lex_brackets);
10451     PL_lex_brackstack   = SAVEPVN(proto_perl->Ilex_brackstack,i);
10452     PL_lex_casemods     = proto_perl->Ilex_casemods;
10453     i = (PL_lex_casemods < 12 ? 12 : PL_lex_casemods);
10454     PL_lex_casestack    = SAVEPVN(proto_perl->Ilex_casestack,i);
10455
10456     Copy(proto_perl->Inextval, PL_nextval, 5, YYSTYPE);
10457     Copy(proto_perl->Inexttype, PL_nexttype, 5, I32);
10458     PL_nexttoke         = proto_perl->Inexttoke;
10459
10460     /* XXX This is probably masking the deeper issue of why
10461      * SvANY(proto_perl->Ilinestr) can be NULL at this point. For test case:
10462      * http://archive.develooper.com/perl5-porters%40perl.org/msg83298.html
10463      * (A little debugging with a watchpoint on it may help.)
10464      */
10465     if (SvANY(proto_perl->Ilinestr)) {
10466         PL_linestr              = sv_dup_inc(proto_perl->Ilinestr, param);
10467         i = proto_perl->Ibufptr - SvPVX_const(proto_perl->Ilinestr);
10468         PL_bufptr               = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10469         i = proto_perl->Ioldbufptr - SvPVX_const(proto_perl->Ilinestr);
10470         PL_oldbufptr    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10471         i = proto_perl->Ioldoldbufptr - SvPVX_const(proto_perl->Ilinestr);
10472         PL_oldoldbufptr = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10473         i = proto_perl->Ilinestart - SvPVX_const(proto_perl->Ilinestr);
10474         PL_linestart    = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10475     }
10476     else {
10477         PL_linestr = NEWSV(65,79);
10478         sv_upgrade(PL_linestr,SVt_PVIV);
10479         sv_setpvn(PL_linestr,"",0);
10480         PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart = SvPVX(PL_linestr);
10481     }
10482     PL_bufend           = SvPVX(PL_linestr) + SvCUR(PL_linestr);
10483     PL_pending_ident    = proto_perl->Ipending_ident;
10484     PL_sublex_info      = proto_perl->Isublex_info;     /* XXX not quite right */
10485
10486     PL_expect           = proto_perl->Iexpect;
10487
10488     PL_multi_start      = proto_perl->Imulti_start;
10489     PL_multi_end        = proto_perl->Imulti_end;
10490     PL_multi_open       = proto_perl->Imulti_open;
10491     PL_multi_close      = proto_perl->Imulti_close;
10492
10493     PL_error_count      = proto_perl->Ierror_count;
10494     PL_subline          = proto_perl->Isubline;
10495     PL_subname          = sv_dup_inc(proto_perl->Isubname, param);
10496
10497     /* XXX See comment on SvANY(proto_perl->Ilinestr) above */
10498     if (SvANY(proto_perl->Ilinestr)) {
10499         i = proto_perl->Ilast_uni - SvPVX_const(proto_perl->Ilinestr);
10500         PL_last_uni             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10501         i = proto_perl->Ilast_lop - SvPVX_const(proto_perl->Ilinestr);
10502         PL_last_lop             = SvPVX(PL_linestr) + (i < 0 ? 0 : i);
10503         PL_last_lop_op  = proto_perl->Ilast_lop_op;
10504     }
10505     else {
10506         PL_last_uni     = SvPVX(PL_linestr);
10507         PL_last_lop     = SvPVX(PL_linestr);
10508         PL_last_lop_op  = 0;
10509     }
10510     PL_in_my            = proto_perl->Iin_my;
10511     PL_in_my_stash      = hv_dup(proto_perl->Iin_my_stash, param);
10512 #ifdef FCRYPT
10513     PL_cryptseen        = proto_perl->Icryptseen;
10514 #endif
10515
10516     PL_hints            = proto_perl->Ihints;
10517
10518     PL_amagic_generation        = proto_perl->Iamagic_generation;
10519
10520 #ifdef USE_LOCALE_COLLATE
10521     PL_collation_ix     = proto_perl->Icollation_ix;
10522     PL_collation_name   = SAVEPV(proto_perl->Icollation_name);
10523     PL_collation_standard       = proto_perl->Icollation_standard;
10524     PL_collxfrm_base    = proto_perl->Icollxfrm_base;
10525     PL_collxfrm_mult    = proto_perl->Icollxfrm_mult;
10526 #endif /* USE_LOCALE_COLLATE */
10527
10528 #ifdef USE_LOCALE_NUMERIC
10529     PL_numeric_name     = SAVEPV(proto_perl->Inumeric_name);
10530     PL_numeric_standard = proto_perl->Inumeric_standard;
10531     PL_numeric_local    = proto_perl->Inumeric_local;
10532     PL_numeric_radix_sv = sv_dup_inc(proto_perl->Inumeric_radix_sv, param);
10533 #endif /* !USE_LOCALE_NUMERIC */
10534
10535     /* utf8 character classes */
10536     PL_utf8_alnum       = sv_dup_inc(proto_perl->Iutf8_alnum, param);
10537     PL_utf8_alnumc      = sv_dup_inc(proto_perl->Iutf8_alnumc, param);
10538     PL_utf8_ascii       = sv_dup_inc(proto_perl->Iutf8_ascii, param);
10539     PL_utf8_alpha       = sv_dup_inc(proto_perl->Iutf8_alpha, param);
10540     PL_utf8_space       = sv_dup_inc(proto_perl->Iutf8_space, param);
10541     PL_utf8_cntrl       = sv_dup_inc(proto_perl->Iutf8_cntrl, param);
10542     PL_utf8_graph       = sv_dup_inc(proto_perl->Iutf8_graph, param);
10543     PL_utf8_digit       = sv_dup_inc(proto_perl->Iutf8_digit, param);
10544     PL_utf8_upper       = sv_dup_inc(proto_perl->Iutf8_upper, param);
10545     PL_utf8_lower       = sv_dup_inc(proto_perl->Iutf8_lower, param);
10546     PL_utf8_print       = sv_dup_inc(proto_perl->Iutf8_print, param);
10547     PL_utf8_punct       = sv_dup_inc(proto_perl->Iutf8_punct, param);
10548     PL_utf8_xdigit      = sv_dup_inc(proto_perl->Iutf8_xdigit, param);
10549     PL_utf8_mark        = sv_dup_inc(proto_perl->Iutf8_mark, param);
10550     PL_utf8_toupper     = sv_dup_inc(proto_perl->Iutf8_toupper, param);
10551     PL_utf8_totitle     = sv_dup_inc(proto_perl->Iutf8_totitle, param);
10552     PL_utf8_tolower     = sv_dup_inc(proto_perl->Iutf8_tolower, param);
10553     PL_utf8_tofold      = sv_dup_inc(proto_perl->Iutf8_tofold, param);
10554     PL_utf8_idstart     = sv_dup_inc(proto_perl->Iutf8_idstart, param);
10555     PL_utf8_idcont      = sv_dup_inc(proto_perl->Iutf8_idcont, param);
10556
10557     /* Did the locale setup indicate UTF-8? */
10558     PL_utf8locale       = proto_perl->Iutf8locale;
10559     /* Unicode features (see perlrun/-C) */
10560     PL_unicode          = proto_perl->Iunicode;
10561
10562     /* Pre-5.8 signals control */
10563     PL_signals          = proto_perl->Isignals;
10564
10565     /* times() ticks per second */
10566     PL_clocktick        = proto_perl->Iclocktick;
10567
10568     /* Recursion stopper for PerlIO_find_layer */
10569     PL_in_load_module   = proto_perl->Iin_load_module;
10570
10571     /* sort() routine */
10572     PL_sort_RealCmp     = proto_perl->Isort_RealCmp;
10573
10574     /* Not really needed/useful since the reenrant_retint is "volatile",
10575      * but do it for consistency's sake. */
10576     PL_reentrant_retint = proto_perl->Ireentrant_retint;
10577
10578     /* Hooks to shared SVs and locks. */
10579     PL_sharehook        = proto_perl->Isharehook;
10580     PL_lockhook         = proto_perl->Ilockhook;
10581     PL_unlockhook       = proto_perl->Iunlockhook;
10582     PL_threadhook       = proto_perl->Ithreadhook;
10583
10584     PL_runops_std       = proto_perl->Irunops_std;
10585     PL_runops_dbg       = proto_perl->Irunops_dbg;
10586
10587 #ifdef THREADS_HAVE_PIDS
10588     PL_ppid             = proto_perl->Ippid;
10589 #endif
10590
10591     /* swatch cache */
10592     PL_last_swash_hv    = Nullhv;       /* reinits on demand */
10593     PL_last_swash_klen  = 0;
10594     PL_last_swash_key[0]= '\0';
10595     PL_last_swash_tmps  = (U8*)NULL;
10596     PL_last_swash_slen  = 0;
10597
10598     PL_glob_index       = proto_perl->Iglob_index;
10599     PL_srand_called     = proto_perl->Isrand_called;
10600     PL_uudmap['M']      = 0;            /* reinits on demand */
10601     PL_bitcount         = Nullch;       /* reinits on demand */
10602
10603     if (proto_perl->Ipsig_pend) {
10604         Newxz(PL_psig_pend, SIG_SIZE, int);
10605     }
10606     else {
10607         PL_psig_pend    = (int*)NULL;
10608     }
10609
10610     if (proto_perl->Ipsig_ptr) {
10611         Newxz(PL_psig_ptr,  SIG_SIZE, SV*);
10612         Newxz(PL_psig_name, SIG_SIZE, SV*);
10613         for (i = 1; i < SIG_SIZE; i++) {
10614             PL_psig_ptr[i]  = sv_dup_inc(proto_perl->Ipsig_ptr[i], param);
10615             PL_psig_name[i] = sv_dup_inc(proto_perl->Ipsig_name[i], param);
10616         }
10617     }
10618     else {
10619         PL_psig_ptr     = (SV**)NULL;
10620         PL_psig_name    = (SV**)NULL;
10621     }
10622
10623     /* thrdvar.h stuff */
10624
10625     if (flags & CLONEf_COPY_STACKS) {
10626         /* next allocation will be PL_tmps_stack[PL_tmps_ix+1] */
10627         PL_tmps_ix              = proto_perl->Ttmps_ix;
10628         PL_tmps_max             = proto_perl->Ttmps_max;
10629         PL_tmps_floor           = proto_perl->Ttmps_floor;
10630         Newxz(PL_tmps_stack, PL_tmps_max, SV*);
10631         i = 0;
10632         while (i <= PL_tmps_ix) {
10633             PL_tmps_stack[i]    = sv_dup_inc(proto_perl->Ttmps_stack[i], param);
10634             ++i;
10635         }
10636
10637         /* next PUSHMARK() sets *(PL_markstack_ptr+1) */
10638         i = proto_perl->Tmarkstack_max - proto_perl->Tmarkstack;
10639         Newxz(PL_markstack, i, I32);
10640         PL_markstack_max        = PL_markstack + (proto_perl->Tmarkstack_max
10641                                                   - proto_perl->Tmarkstack);
10642         PL_markstack_ptr        = PL_markstack + (proto_perl->Tmarkstack_ptr
10643                                                   - proto_perl->Tmarkstack);
10644         Copy(proto_perl->Tmarkstack, PL_markstack,
10645              PL_markstack_ptr - PL_markstack + 1, I32);
10646
10647         /* next push_scope()/ENTER sets PL_scopestack[PL_scopestack_ix]
10648          * NOTE: unlike the others! */
10649         PL_scopestack_ix        = proto_perl->Tscopestack_ix;
10650         PL_scopestack_max       = proto_perl->Tscopestack_max;
10651         Newxz(PL_scopestack, PL_scopestack_max, I32);
10652         Copy(proto_perl->Tscopestack, PL_scopestack, PL_scopestack_ix, I32);
10653
10654         /* NOTE: si_dup() looks at PL_markstack */
10655         PL_curstackinfo         = si_dup(proto_perl->Tcurstackinfo, param);
10656
10657         /* PL_curstack          = PL_curstackinfo->si_stack; */
10658         PL_curstack             = av_dup(proto_perl->Tcurstack, param);
10659         PL_mainstack            = av_dup(proto_perl->Tmainstack, param);
10660
10661         /* next PUSHs() etc. set *(PL_stack_sp+1) */
10662         PL_stack_base           = AvARRAY(PL_curstack);
10663         PL_stack_sp             = PL_stack_base + (proto_perl->Tstack_sp
10664                                                    - proto_perl->Tstack_base);
10665         PL_stack_max            = PL_stack_base + AvMAX(PL_curstack);
10666
10667         /* next SSPUSHFOO() sets PL_savestack[PL_savestack_ix]
10668          * NOTE: unlike the others! */
10669         PL_savestack_ix         = proto_perl->Tsavestack_ix;
10670         PL_savestack_max        = proto_perl->Tsavestack_max;
10671         /*Newxz(PL_savestack, PL_savestack_max, ANY);*/
10672         PL_savestack            = ss_dup(proto_perl, param);
10673     }
10674     else {
10675         init_stacks();
10676         ENTER;                  /* perl_destruct() wants to LEAVE; */
10677     }
10678
10679     PL_start_env        = proto_perl->Tstart_env;       /* XXXXXX */
10680     PL_top_env          = &PL_start_env;
10681
10682     PL_op               = proto_perl->Top;
10683
10684     PL_Sv               = Nullsv;
10685     PL_Xpv              = (XPV*)NULL;
10686     PL_na               = proto_perl->Tna;
10687
10688     PL_statbuf          = proto_perl->Tstatbuf;
10689     PL_statcache        = proto_perl->Tstatcache;
10690     PL_statgv           = gv_dup(proto_perl->Tstatgv, param);
10691     PL_statname         = sv_dup_inc(proto_perl->Tstatname, param);
10692 #ifdef HAS_TIMES
10693     PL_timesbuf         = proto_perl->Ttimesbuf;
10694 #endif
10695
10696     PL_tainted          = proto_perl->Ttainted;
10697     PL_curpm            = proto_perl->Tcurpm;   /* XXX No PMOP ref count */
10698     PL_rs               = sv_dup_inc(proto_perl->Trs, param);
10699     PL_last_in_gv       = gv_dup(proto_perl->Tlast_in_gv, param);
10700     PL_ofs_sv           = sv_dup_inc(proto_perl->Tofs_sv, param);
10701     PL_defoutgv         = gv_dup_inc(proto_perl->Tdefoutgv, param);
10702     PL_chopset          = proto_perl->Tchopset; /* XXX never deallocated */
10703     PL_toptarget        = sv_dup_inc(proto_perl->Ttoptarget, param);
10704     PL_bodytarget       = sv_dup_inc(proto_perl->Tbodytarget, param);
10705     PL_formtarget       = sv_dup(proto_perl->Tformtarget, param);
10706
10707     PL_restartop        = proto_perl->Trestartop;
10708     PL_in_eval          = proto_perl->Tin_eval;
10709     PL_delaymagic       = proto_perl->Tdelaymagic;
10710     PL_dirty            = proto_perl->Tdirty;
10711     PL_localizing       = proto_perl->Tlocalizing;
10712
10713     PL_errors           = sv_dup_inc(proto_perl->Terrors, param);
10714     PL_hv_fetch_ent_mh  = Nullhe;
10715     PL_modcount         = proto_perl->Tmodcount;
10716     PL_lastgotoprobe    = Nullop;
10717     PL_dumpindent       = proto_perl->Tdumpindent;
10718
10719     PL_sortcop          = (OP*)any_dup(proto_perl->Tsortcop, proto_perl);
10720     PL_sortstash        = hv_dup(proto_perl->Tsortstash, param);
10721     PL_firstgv          = gv_dup(proto_perl->Tfirstgv, param);
10722     PL_secondgv         = gv_dup(proto_perl->Tsecondgv, param);
10723     PL_efloatbuf        = Nullch;               /* reinits on demand */
10724     PL_efloatsize       = 0;                    /* reinits on demand */
10725
10726     /* regex stuff */
10727
10728     PL_screamfirst      = NULL;
10729     PL_screamnext       = NULL;
10730     PL_maxscream        = -1;                   /* reinits on demand */
10731     PL_lastscream       = Nullsv;
10732
10733     PL_watchaddr        = NULL;
10734     PL_watchok          = Nullch;
10735
10736     PL_regdummy         = proto_perl->Tregdummy;
10737     PL_regprecomp       = Nullch;
10738     PL_regnpar          = 0;
10739     PL_regsize          = 0;
10740     PL_colorset         = 0;            /* reinits PL_colors[] */
10741     /*PL_colors[6]      = {0,0,0,0,0,0};*/
10742     PL_reginput         = Nullch;
10743     PL_regbol           = Nullch;
10744     PL_regeol           = Nullch;
10745     PL_regstartp        = (I32*)NULL;
10746     PL_regendp          = (I32*)NULL;
10747     PL_reglastparen     = (U32*)NULL;
10748     PL_reglastcloseparen        = (U32*)NULL;
10749     PL_regtill          = Nullch;
10750     PL_reg_start_tmp    = (char**)NULL;
10751     PL_reg_start_tmpl   = 0;
10752     PL_regdata          = (struct reg_data*)NULL;
10753     PL_bostr            = Nullch;
10754     PL_reg_flags        = 0;
10755     PL_reg_eval_set     = 0;
10756     PL_regnarrate       = 0;
10757     PL_regprogram       = (regnode*)NULL;
10758     PL_regindent        = 0;
10759     PL_regcc            = (CURCUR*)NULL;
10760     PL_reg_call_cc      = (struct re_cc_state*)NULL;
10761     PL_reg_re           = (regexp*)NULL;
10762     PL_reg_ganch        = Nullch;
10763     PL_reg_sv           = Nullsv;
10764     PL_reg_match_utf8   = FALSE;
10765     PL_reg_magic        = (MAGIC*)NULL;
10766     PL_reg_oldpos       = 0;
10767     PL_reg_oldcurpm     = (PMOP*)NULL;
10768     PL_reg_curpm        = (PMOP*)NULL;
10769     PL_reg_oldsaved     = Nullch;
10770     PL_reg_oldsavedlen  = 0;
10771 #ifdef PERL_OLD_COPY_ON_WRITE
10772     PL_nrs              = Nullsv;
10773 #endif
10774     PL_reg_maxiter      = 0;
10775     PL_reg_leftiter     = 0;
10776     PL_reg_poscache     = Nullch;
10777     PL_reg_poscache_size= 0;
10778
10779     /* RE engine - function pointers */
10780     PL_regcompp         = proto_perl->Tregcompp;
10781     PL_regexecp         = proto_perl->Tregexecp;
10782     PL_regint_start     = proto_perl->Tregint_start;
10783     PL_regint_string    = proto_perl->Tregint_string;
10784     PL_regfree          = proto_perl->Tregfree;
10785
10786     PL_reginterp_cnt    = 0;
10787     PL_reg_starttry     = 0;
10788
10789     /* Pluggable optimizer */
10790     PL_peepp            = proto_perl->Tpeepp;
10791
10792     PL_stashcache       = newHV();
10793
10794     if (!(flags & CLONEf_KEEP_PTR_TABLE)) {
10795         ptr_table_free(PL_ptr_table);
10796         PL_ptr_table = NULL;
10797     }
10798
10799     /* Call the ->CLONE method, if it exists, for each of the stashes
10800        identified by sv_dup() above.
10801     */
10802     while(av_len(param->stashes) != -1) {
10803         HV* const stash = (HV*) av_shift(param->stashes);
10804         GV* const cloner = gv_fetchmethod_autoload(stash, "CLONE", 0);
10805         if (cloner && GvCV(cloner)) {
10806             dSP;
10807             ENTER;
10808             SAVETMPS;
10809             PUSHMARK(SP);
10810             XPUSHs(sv_2mortal(newSVhek(HvNAME_HEK(stash))));
10811             PUTBACK;
10812             call_sv((SV*)GvCV(cloner), G_DISCARD);
10813             FREETMPS;
10814             LEAVE;
10815         }
10816     }
10817
10818     SvREFCNT_dec(param->stashes);
10819
10820     /* orphaned? eg threads->new inside BEGIN or use */
10821     if (PL_compcv && ! SvREFCNT(PL_compcv)) {
10822         (void)SvREFCNT_inc(PL_compcv);
10823         SAVEFREESV(PL_compcv);
10824     }
10825
10826     return my_perl;
10827 }
10828
10829 #endif /* USE_ITHREADS */
10830
10831 /*
10832 =head1 Unicode Support
10833
10834 =for apidoc sv_recode_to_utf8
10835
10836 The encoding is assumed to be an Encode object, on entry the PV
10837 of the sv is assumed to be octets in that encoding, and the sv
10838 will be converted into Unicode (and UTF-8).
10839
10840 If the sv already is UTF-8 (or if it is not POK), or if the encoding
10841 is not a reference, nothing is done to the sv.  If the encoding is not
10842 an C<Encode::XS> Encoding object, bad things will happen.
10843 (See F<lib/encoding.pm> and L<Encode>).
10844
10845 The PV of the sv is returned.
10846
10847 =cut */
10848
10849 char *
10850 Perl_sv_recode_to_utf8(pTHX_ SV *sv, SV *encoding)
10851 {
10852     dVAR;
10853     if (SvPOK(sv) && !SvUTF8(sv) && !IN_BYTES && SvROK(encoding)) {
10854         SV *uni;
10855         STRLEN len;
10856         const char *s;
10857         dSP;
10858         ENTER;
10859         SAVETMPS;
10860         save_re_context();
10861         PUSHMARK(sp);
10862         EXTEND(SP, 3);
10863         XPUSHs(encoding);
10864         XPUSHs(sv);
10865 /*
10866   NI-S 2002/07/09
10867   Passing sv_yes is wrong - it needs to be or'ed set of constants
10868   for Encode::XS, while UTf-8 decode (currently) assumes a true value means
10869   remove converted chars from source.
10870
10871   Both will default the value - let them.
10872
10873         XPUSHs(&PL_sv_yes);
10874 */
10875         PUTBACK;
10876         call_method("decode", G_SCALAR);
10877         SPAGAIN;
10878         uni = POPs;
10879         PUTBACK;
10880         s = SvPV_const(uni, len);
10881         if (s != SvPVX_const(sv)) {
10882             SvGROW(sv, len + 1);
10883             Move(s, SvPVX(sv), len + 1, char);
10884             SvCUR_set(sv, len);
10885         }
10886         FREETMPS;
10887         LEAVE;
10888         SvUTF8_on(sv);
10889         return SvPVX(sv);
10890     }
10891     return SvPOKp(sv) ? SvPVX(sv) : NULL;
10892 }
10893
10894 /*
10895 =for apidoc sv_cat_decode
10896
10897 The encoding is assumed to be an Encode object, the PV of the ssv is
10898 assumed to be octets in that encoding and decoding the input starts
10899 from the position which (PV + *offset) pointed to.  The dsv will be
10900 concatenated the decoded UTF-8 string from ssv.  Decoding will terminate
10901 when the string tstr appears in decoding output or the input ends on
10902 the PV of the ssv. The value which the offset points will be modified
10903 to the last input position on the ssv.
10904
10905 Returns TRUE if the terminator was found, else returns FALSE.
10906
10907 =cut */
10908
10909 bool
10910 Perl_sv_cat_decode(pTHX_ SV *dsv, SV *encoding,
10911                    SV *ssv, int *offset, char *tstr, int tlen)
10912 {
10913     dVAR;
10914     bool ret = FALSE;
10915     if (SvPOK(ssv) && SvPOK(dsv) && SvROK(encoding) && offset) {
10916         SV *offsv;
10917         dSP;
10918         ENTER;
10919         SAVETMPS;
10920         save_re_context();
10921         PUSHMARK(sp);
10922         EXTEND(SP, 6);
10923         XPUSHs(encoding);
10924         XPUSHs(dsv);
10925         XPUSHs(ssv);
10926         XPUSHs(offsv = sv_2mortal(newSViv(*offset)));
10927         XPUSHs(sv_2mortal(newSVpvn(tstr, tlen)));
10928         PUTBACK;
10929         call_method("cat_decode", G_SCALAR);
10930         SPAGAIN;
10931         ret = SvTRUE(TOPs);
10932         *offset = SvIV(offsv);
10933         PUTBACK;
10934         FREETMPS;
10935         LEAVE;
10936     }
10937     else
10938         Perl_croak(aTHX_ "Invalid argument to sv_cat_decode");
10939     return ret;
10940
10941 }
10942
10943 /* ---------------------------------------------------------------------
10944  *
10945  * support functions for report_uninit()
10946  */
10947
10948 /* the maxiumum size of array or hash where we will scan looking
10949  * for the undefined element that triggered the warning */
10950
10951 #define FUV_MAX_SEARCH_SIZE 1000
10952
10953 /* Look for an entry in the hash whose value has the same SV as val;
10954  * If so, return a mortal copy of the key. */
10955
10956 STATIC SV*
10957 S_find_hash_subscript(pTHX_ HV *hv, SV* val)
10958 {
10959     dVAR;
10960     register HE **array;
10961     I32 i;
10962
10963     if (!hv || SvMAGICAL(hv) || !HvARRAY(hv) ||
10964                         (HvTOTALKEYS(hv) > FUV_MAX_SEARCH_SIZE))
10965         return Nullsv;
10966
10967     array = HvARRAY(hv);
10968
10969     for (i=HvMAX(hv); i>0; i--) {
10970         register HE *entry;
10971         for (entry = array[i]; entry; entry = HeNEXT(entry)) {
10972             if (HeVAL(entry) != val)
10973                 continue;
10974             if (    HeVAL(entry) == &PL_sv_undef ||
10975                     HeVAL(entry) == &PL_sv_placeholder)
10976                 continue;
10977             if (!HeKEY(entry))
10978                 return Nullsv;
10979             if (HeKLEN(entry) == HEf_SVKEY)
10980                 return sv_mortalcopy(HeKEY_sv(entry));
10981             return sv_2mortal(newSVpvn(HeKEY(entry), HeKLEN(entry)));
10982         }
10983     }
10984     return Nullsv;
10985 }
10986
10987 /* Look for an entry in the array whose value has the same SV as val;
10988  * If so, return the index, otherwise return -1. */
10989
10990 STATIC I32
10991 S_find_array_subscript(pTHX_ AV *av, SV* val)
10992 {
10993     SV** svp;
10994     I32 i;
10995     if (!av || SvMAGICAL(av) || !AvARRAY(av) ||
10996                         (AvFILLp(av) > FUV_MAX_SEARCH_SIZE))
10997         return -1;
10998
10999     svp = AvARRAY(av);
11000     for (i=AvFILLp(av); i>=0; i--) {
11001         if (svp[i] == val && svp[i] != &PL_sv_undef)
11002             return i;
11003     }
11004     return -1;
11005 }
11006
11007 /* S_varname(): return the name of a variable, optionally with a subscript.
11008  * If gv is non-zero, use the name of that global, along with gvtype (one
11009  * of "$", "@", "%"); otherwise use the name of the lexical at pad offset
11010  * targ.  Depending on the value of the subscript_type flag, return:
11011  */
11012
11013 #define FUV_SUBSCRIPT_NONE      1       /* "@foo"          */
11014 #define FUV_SUBSCRIPT_ARRAY     2       /* "$foo[aindex]"  */
11015 #define FUV_SUBSCRIPT_HASH      3       /* "$foo{keyname}" */
11016 #define FUV_SUBSCRIPT_WITHIN    4       /* "within @foo"   */
11017
11018 STATIC SV*
11019 S_varname(pTHX_ GV *gv, const char gvtype, PADOFFSET targ,
11020         SV* keyname, I32 aindex, int subscript_type)
11021 {
11022
11023     SV * const name = sv_newmortal();
11024     if (gv) {
11025         char buffer[2];
11026         buffer[0] = gvtype;
11027         buffer[1] = 0;
11028
11029         /* as gv_fullname4(), but add literal '^' for $^FOO names  */
11030
11031         gv_fullname4(name, gv, buffer, 0);
11032
11033         if ((unsigned int)SvPVX(name)[1] <= 26) {
11034             buffer[0] = '^';
11035             buffer[1] = SvPVX(name)[1] + 'A' - 1;
11036
11037             /* Swap the 1 unprintable control character for the 2 byte pretty
11038                version - ie substr($name, 1, 1) = $buffer; */
11039             sv_insert(name, 1, 1, buffer, 2);
11040         }
11041     }
11042     else {
11043         U32 unused;
11044         CV * const cv = find_runcv(&unused);
11045         SV *sv;
11046         AV *av;
11047
11048         if (!cv || !CvPADLIST(cv))
11049             return Nullsv;
11050         av = (AV*)(*av_fetch(CvPADLIST(cv), 0, FALSE));
11051         sv = *av_fetch(av, targ, FALSE);
11052         /* SvLEN in a pad name is not to be trusted */
11053         sv_setpv(name, SvPV_nolen_const(sv));
11054     }
11055
11056     if (subscript_type == FUV_SUBSCRIPT_HASH) {
11057         SV * const sv = NEWSV(0,0);
11058         *SvPVX(name) = '$';
11059         Perl_sv_catpvf(aTHX_ name, "{%s}",
11060             pv_display(sv,SvPVX_const(keyname), SvCUR(keyname), 0, 32));
11061         SvREFCNT_dec(sv);
11062     }
11063     else if (subscript_type == FUV_SUBSCRIPT_ARRAY) {
11064         *SvPVX(name) = '$';
11065         Perl_sv_catpvf(aTHX_ name, "[%"IVdf"]", (IV)aindex);
11066     }
11067     else if (subscript_type == FUV_SUBSCRIPT_WITHIN)
11068         sv_insert(name, 0, 0,  "within ", 7);
11069
11070     return name;
11071 }
11072
11073
11074 /*
11075 =for apidoc find_uninit_var
11076
11077 Find the name of the undefined variable (if any) that caused the operator o
11078 to issue a "Use of uninitialized value" warning.
11079 If match is true, only return a name if it's value matches uninit_sv.
11080 So roughly speaking, if a unary operator (such as OP_COS) generates a
11081 warning, then following the direct child of the op may yield an
11082 OP_PADSV or OP_GV that gives the name of the undefined variable. On the
11083 other hand, with OP_ADD there are two branches to follow, so we only print
11084 the variable name if we get an exact match.
11085
11086 The name is returned as a mortal SV.
11087
11088 Assumes that PL_op is the op that originally triggered the error, and that
11089 PL_comppad/PL_curpad points to the currently executing pad.
11090
11091 =cut
11092 */
11093
11094 STATIC SV *
11095 S_find_uninit_var(pTHX_ OP* obase, SV* uninit_sv, bool match)
11096 {
11097     dVAR;
11098     SV *sv;
11099     AV *av;
11100     GV *gv;
11101     OP *o, *o2, *kid;
11102
11103     if (!obase || (match && (!uninit_sv || uninit_sv == &PL_sv_undef ||
11104                             uninit_sv == &PL_sv_placeholder)))
11105         return Nullsv;
11106
11107     switch (obase->op_type) {
11108
11109     case OP_RV2AV:
11110     case OP_RV2HV:
11111     case OP_PADAV:
11112     case OP_PADHV:
11113       {
11114         const bool pad  = (obase->op_type == OP_PADAV || obase->op_type == OP_PADHV);
11115         const bool hash = (obase->op_type == OP_PADHV || obase->op_type == OP_RV2HV);
11116         I32 index = 0;
11117         SV *keysv = Nullsv;
11118         int subscript_type = FUV_SUBSCRIPT_WITHIN;
11119
11120         if (pad) { /* @lex, %lex */
11121             sv = PAD_SVl(obase->op_targ);
11122             gv = Nullgv;
11123         }
11124         else {
11125             if (cUNOPx(obase)->op_first->op_type == OP_GV) {
11126             /* @global, %global */
11127                 gv = cGVOPx_gv(cUNOPx(obase)->op_first);
11128                 if (!gv)
11129                     break;
11130                 sv = hash ? (SV*)GvHV(gv): (SV*)GvAV(gv);
11131             }
11132             else /* @{expr}, %{expr} */
11133                 return find_uninit_var(cUNOPx(obase)->op_first,
11134                                                     uninit_sv, match);
11135         }
11136
11137         /* attempt to find a match within the aggregate */
11138         if (hash) {
11139             keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11140             if (keysv)
11141                 subscript_type = FUV_SUBSCRIPT_HASH;
11142         }
11143         else {
11144             index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11145             if (index >= 0)
11146                 subscript_type = FUV_SUBSCRIPT_ARRAY;
11147         }
11148
11149         if (match && subscript_type == FUV_SUBSCRIPT_WITHIN)
11150             break;
11151
11152         return varname(gv, hash ? '%' : '@', obase->op_targ,
11153                                     keysv, index, subscript_type);
11154       }
11155
11156     case OP_PADSV:
11157         if (match && PAD_SVl(obase->op_targ) != uninit_sv)
11158             break;
11159         return varname(Nullgv, '$', obase->op_targ,
11160                                     Nullsv, 0, FUV_SUBSCRIPT_NONE);
11161
11162     case OP_GVSV:
11163         gv = cGVOPx_gv(obase);
11164         if (!gv || (match && GvSV(gv) != uninit_sv))
11165             break;
11166         return varname(gv, '$', 0, Nullsv, 0, FUV_SUBSCRIPT_NONE);
11167
11168     case OP_AELEMFAST:
11169         if (obase->op_flags & OPf_SPECIAL) { /* lexical array */
11170             if (match) {
11171                 SV **svp;
11172                 av = (AV*)PAD_SV(obase->op_targ);
11173                 if (!av || SvRMAGICAL(av))
11174                     break;
11175                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11176                 if (!svp || *svp != uninit_sv)
11177                     break;
11178             }
11179             return varname(Nullgv, '$', obase->op_targ,
11180                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11181         }
11182         else {
11183             gv = cGVOPx_gv(obase);
11184             if (!gv)
11185                 break;
11186             if (match) {
11187                 SV **svp;
11188                 av = GvAV(gv);
11189                 if (!av || SvRMAGICAL(av))
11190                     break;
11191                 svp = av_fetch(av, (I32)obase->op_private, FALSE);
11192                 if (!svp || *svp != uninit_sv)
11193                     break;
11194             }
11195             return varname(gv, '$', 0,
11196                     Nullsv, (I32)obase->op_private, FUV_SUBSCRIPT_ARRAY);
11197         }
11198         break;
11199
11200     case OP_EXISTS:
11201         o = cUNOPx(obase)->op_first;
11202         if (!o || o->op_type != OP_NULL ||
11203                 ! (o->op_targ == OP_AELEM || o->op_targ == OP_HELEM))
11204             break;
11205         return find_uninit_var(cBINOPo->op_last, uninit_sv, match);
11206
11207     case OP_AELEM:
11208     case OP_HELEM:
11209         if (PL_op == obase)
11210             /* $a[uninit_expr] or $h{uninit_expr} */
11211             return find_uninit_var(cBINOPx(obase)->op_last, uninit_sv, match);
11212
11213         gv = Nullgv;
11214         o = cBINOPx(obase)->op_first;
11215         kid = cBINOPx(obase)->op_last;
11216
11217         /* get the av or hv, and optionally the gv */
11218         sv = Nullsv;
11219         if  (o->op_type == OP_PADAV || o->op_type == OP_PADHV) {
11220             sv = PAD_SV(o->op_targ);
11221         }
11222         else if ((o->op_type == OP_RV2AV || o->op_type == OP_RV2HV)
11223                 && cUNOPo->op_first->op_type == OP_GV)
11224         {
11225             gv = cGVOPx_gv(cUNOPo->op_first);
11226             if (!gv)
11227                 break;
11228             sv = o->op_type == OP_RV2HV ? (SV*)GvHV(gv) : (SV*)GvAV(gv);
11229         }
11230         if (!sv)
11231             break;
11232
11233         if (kid && kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid))) {
11234             /* index is constant */
11235             if (match) {
11236                 if (SvMAGICAL(sv))
11237                     break;
11238                 if (obase->op_type == OP_HELEM) {
11239                     HE* he = hv_fetch_ent((HV*)sv, cSVOPx_sv(kid), 0, 0);
11240                     if (!he || HeVAL(he) != uninit_sv)
11241                         break;
11242                 }
11243                 else {
11244                     SV ** const svp = av_fetch((AV*)sv, SvIV(cSVOPx_sv(kid)), FALSE);
11245                     if (!svp || *svp != uninit_sv)
11246                         break;
11247                 }
11248             }
11249             if (obase->op_type == OP_HELEM)
11250                 return varname(gv, '%', o->op_targ,
11251                             cSVOPx_sv(kid), 0, FUV_SUBSCRIPT_HASH);
11252             else
11253                 return varname(gv, '@', o->op_targ, Nullsv,
11254                             SvIV(cSVOPx_sv(kid)), FUV_SUBSCRIPT_ARRAY);
11255             ;
11256         }
11257         else  {
11258             /* index is an expression;
11259              * attempt to find a match within the aggregate */
11260             if (obase->op_type == OP_HELEM) {
11261                 SV * const keysv = S_find_hash_subscript(aTHX_ (HV*)sv, uninit_sv);
11262                 if (keysv)
11263                     return varname(gv, '%', o->op_targ,
11264                                                 keysv, 0, FUV_SUBSCRIPT_HASH);
11265             }
11266             else {
11267                 const I32 index = S_find_array_subscript(aTHX_ (AV*)sv, uninit_sv);
11268                 if (index >= 0)
11269                     return varname(gv, '@', o->op_targ,
11270                                         Nullsv, index, FUV_SUBSCRIPT_ARRAY);
11271             }
11272             if (match)
11273                 break;
11274             return varname(gv,
11275                 (o->op_type == OP_PADAV || o->op_type == OP_RV2AV)
11276                 ? '@' : '%',
11277                 o->op_targ, Nullsv, 0, FUV_SUBSCRIPT_WITHIN);
11278         }
11279
11280         break;
11281
11282     case OP_AASSIGN:
11283         /* only examine RHS */
11284         return find_uninit_var(cBINOPx(obase)->op_first, uninit_sv, match);
11285
11286     case OP_OPEN:
11287         o = cUNOPx(obase)->op_first;
11288         if (o->op_type == OP_PUSHMARK)
11289             o = o->op_sibling;
11290
11291         if (!o->op_sibling) {
11292             /* one-arg version of open is highly magical */
11293
11294             if (o->op_type == OP_GV) { /* open FOO; */
11295                 gv = cGVOPx_gv(o);
11296                 if (match && GvSV(gv) != uninit_sv)
11297                     break;
11298                 return varname(gv, '$', 0,
11299                             Nullsv, 0, FUV_SUBSCRIPT_NONE);
11300             }
11301             /* other possibilities not handled are:
11302              * open $x; or open my $x;  should return '${*$x}'
11303              * open expr;               should return '$'.expr ideally
11304              */
11305              break;
11306         }
11307         goto do_op;
11308
11309     /* ops where $_ may be an implicit arg */
11310     case OP_TRANS:
11311     case OP_SUBST:
11312     case OP_MATCH:
11313         if ( !(obase->op_flags & OPf_STACKED)) {
11314             if (uninit_sv == ((obase->op_private & OPpTARGET_MY)
11315                                  ? PAD_SVl(obase->op_targ)
11316                                  : DEFSV))
11317             {
11318                 sv = sv_newmortal();
11319                 sv_setpvn(sv, "$_", 2);
11320                 return sv;
11321             }
11322         }
11323         goto do_op;
11324
11325     case OP_PRTF:
11326     case OP_PRINT:
11327         /* skip filehandle as it can't produce 'undef' warning  */
11328         o = cUNOPx(obase)->op_first;
11329         if ((obase->op_flags & OPf_STACKED) && o->op_type == OP_PUSHMARK)
11330             o = o->op_sibling->op_sibling;
11331         goto do_op2;
11332
11333
11334     case OP_RV2SV:
11335     case OP_CUSTOM:
11336     case OP_ENTERSUB:
11337         match = 1; /* XS or custom code could trigger random warnings */
11338         goto do_op;
11339
11340     case OP_SCHOMP:
11341     case OP_CHOMP:
11342         if (SvROK(PL_rs) && uninit_sv == SvRV(PL_rs))
11343             return sv_2mortal(newSVpvn("${$/}", 5));
11344         /* FALL THROUGH */
11345
11346     default:
11347     do_op:
11348         if (!(obase->op_flags & OPf_KIDS))
11349             break;
11350         o = cUNOPx(obase)->op_first;
11351         
11352     do_op2:
11353         if (!o)
11354             break;
11355
11356         /* if all except one arg are constant, or have no side-effects,
11357          * or are optimized away, then it's unambiguous */
11358         o2 = Nullop;
11359         for (kid=o; kid; kid = kid->op_sibling) {
11360             if (kid &&
11361                 (    (kid->op_type == OP_CONST && SvOK(cSVOPx_sv(kid)))
11362                   || (kid->op_type == OP_NULL  && ! (kid->op_flags & OPf_KIDS))
11363                   || (kid->op_type == OP_PUSHMARK)
11364                 )
11365             )
11366                 continue;
11367             if (o2) { /* more than one found */
11368                 o2 = Nullop;
11369                 break;
11370             }
11371             o2 = kid;
11372         }
11373         if (o2)
11374             return find_uninit_var(o2, uninit_sv, match);
11375
11376         /* scan all args */
11377         while (o) {
11378             sv = find_uninit_var(o, uninit_sv, 1);
11379             if (sv)
11380                 return sv;
11381             o = o->op_sibling;
11382         }
11383         break;
11384     }
11385     return Nullsv;
11386 }
11387
11388
11389 /*
11390 =for apidoc report_uninit
11391
11392 Print appropriate "Use of uninitialized variable" warning
11393
11394 =cut
11395 */
11396
11397 void
11398 Perl_report_uninit(pTHX_ SV* uninit_sv)
11399 {
11400     if (PL_op) {
11401         SV* varname = Nullsv;
11402         if (uninit_sv) {
11403             varname = find_uninit_var(PL_op, uninit_sv,0);
11404             if (varname)
11405                 sv_insert(varname, 0, 0, " ", 1);
11406         }
11407         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11408                 varname ? SvPV_nolen_const(varname) : "",
11409                 " in ", OP_DESC(PL_op));
11410     }
11411     else
11412         Perl_warner(aTHX_ packWARN(WARN_UNINITIALIZED), PL_warn_uninit,
11413                     "", "", "");
11414 }
11415
11416 /*
11417  * Local variables:
11418  * c-indentation-style: bsd
11419  * c-basic-offset: 4
11420  * indent-tabs-mode: t
11421  * End:
11422  *
11423  * ex: set ts=8 sts=4 sw=4 noet:
11424  */