[inseparable changes from patch from perl5.003_25 to perl5.003_26]
[p5sagit/p5-mst-13.2.git] / toke.c
1 /*    toke.c
2  *
3  *    Copyright (c) 1991-1994, Larry Wall
4  *
5  *    You may distribute under the terms of either the GNU General Public
6  *    License or the Artistic License, as specified in the README file.
7  *
8  */
9
10 /*
11  *   "It all comes from here, the stench and the peril."  --Frodo
12  */
13
14 #include "EXTERN.h"
15 #include "perl.h"
16
17 static void check_uni _((void));
18 static void  force_next _((I32 type));
19 static char *force_version _((char *start));
20 static char *force_word _((char *start, int token, int check_keyword, int allow_pack, int allow_tick));
21 static SV *q _((SV *sv));
22 static char *scan_const _((char *start));
23 static char *scan_formline _((char *s));
24 static char *scan_heredoc _((char *s));
25 static char *scan_ident _((char *s, char *send, char *dest, I32 ck_uni));
26 static char *scan_inputsymbol _((char *start));
27 static char *scan_pat _((char *start));
28 static char *scan_str _((char *start));
29 static char *scan_subst _((char *start));
30 static char *scan_trans _((char *start));
31 static char *scan_word _((char *s, char *dest, int allow_package, STRLEN *slp));
32 static char *skipspace _((char *s));
33 static void checkcomma _((char *s, char *name, char *what));
34 static void force_ident _((char *s, int kind));
35 static void incline _((char *s));
36 static int intuit_method _((char *s, GV *gv));
37 static int intuit_more _((char *s));
38 static I32 lop _((I32 f, expectation x, char *s));
39 static void missingterm _((char *s));
40 static void no_op _((char *what, char *s));
41 static void set_csh _((void));
42 static I32 sublex_done _((void));
43 static I32 sublex_push _((void));
44 static I32 sublex_start _((void));
45 #ifdef CRIPPLED_CC
46 static int uni _((I32 f, char *s));
47 #endif
48 static char * filter_gets _((SV *sv, PerlIO *fp, STRLEN append));
49 static void restore_rsfp _((void *f));
50
51 static char *linestart;         /* beg. of most recently read line */
52
53 static char pending_ident;      /* pending identifier lookup */
54
55 static struct {
56     I32 super_state;    /* lexer state to save */
57     I32 sub_inwhat;     /* "lex_inwhat" to use */
58     OP *sub_op;         /* "lex_op" to use */
59 } sublex_info;
60
61 /* The following are arranged oddly so that the guard on the switch statement
62  * can get by with a single comparison (if the compiler is smart enough).
63  */
64
65 #define LEX_NORMAL              10
66 #define LEX_INTERPNORMAL         9
67 #define LEX_INTERPCASEMOD        8
68 #define LEX_INTERPPUSH           7
69 #define LEX_INTERPSTART          6
70 #define LEX_INTERPEND            5
71 #define LEX_INTERPENDMAYBE       4
72 #define LEX_INTERPCONCAT         3
73 #define LEX_INTERPCONST          2
74 #define LEX_FORMLINE             1
75 #define LEX_KNOWNEXT             0
76
77 #ifdef I_FCNTL
78 #include <fcntl.h>
79 #endif
80 #ifdef I_SYS_FILE
81 #include <sys/file.h>
82 #endif
83
84 /* XXX If this causes problems, set i_unistd=undef in the hint file.  */
85 #ifdef I_UNISTD
86 #  include <unistd.h> /* Needed for execv() */
87 #endif
88
89
90 #ifdef ff_next
91 #undef ff_next
92 #endif
93
94 #include "keywords.h"
95
96 #ifdef CLINE
97 #undef CLINE
98 #endif
99 #define CLINE (copline = (curcop->cop_line < copline ? curcop->cop_line : copline))
100
101 #define TOKEN(retval) return (bufptr = s,(int)retval)
102 #define OPERATOR(retval) return (expect = XTERM,bufptr = s,(int)retval)
103 #define AOPERATOR(retval) return ao((expect = XTERM,bufptr = s,(int)retval))
104 #define PREBLOCK(retval) return (expect = XBLOCK,bufptr = s,(int)retval)
105 #define PRETERMBLOCK(retval) return (expect = XTERMBLOCK,bufptr = s,(int)retval)
106 #define PREREF(retval) return (expect = XREF,bufptr = s,(int)retval)
107 #define TERM(retval) return (CLINE, expect = XOPERATOR,bufptr = s,(int)retval)
108 #define LOOPX(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)LOOPEX)
109 #define FTST(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)UNIOP)
110 #define FUN0(f) return(yylval.ival = f,expect = XOPERATOR,bufptr = s,(int)FUNC0)
111 #define FUN1(f) return(yylval.ival = f,expect = XOPERATOR,bufptr = s,(int)FUNC1)
112 #define BOop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)BITOROP))
113 #define BAop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)BITANDOP))
114 #define SHop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)SHIFTOP))
115 #define PWop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)POWOP))
116 #define PMop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)MATCHOP)
117 #define Aop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)ADDOP))
118 #define Mop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)MULOP))
119 #define Eop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)EQOP)
120 #define Rop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)RELOP)
121
122 /* This bit of chicanery makes a unary function followed by
123  * a parenthesis into a function with one argument, highest precedence.
124  */
125 #define UNI(f) return(yylval.ival = f, \
126         expect = XTERM, \
127         bufptr = s, \
128         last_uni = oldbufptr, \
129         last_lop_op = f, \
130         (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
131
132 #define UNIBRACK(f) return(yylval.ival = f, \
133         bufptr = s, \
134         last_uni = oldbufptr, \
135         (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
136
137 /* grandfather return to old style */
138 #define OLDLOP(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)LSTOP)
139
140 static int
141 ao(toketype)
142 int toketype;
143 {
144     if (*bufptr == '=') {
145         bufptr++;
146         if (toketype == ANDAND)
147             yylval.ival = OP_ANDASSIGN;
148         else if (toketype == OROR)
149             yylval.ival = OP_ORASSIGN;
150         toketype = ASSIGNOP;
151     }
152     return toketype;
153 }
154
155 static void
156 no_op(what, s)
157 char *what;
158 char *s;
159 {
160     char tmpbuf[128];
161     char *oldbp = bufptr;
162     bool is_first = (oldbufptr == linestart);
163     bufptr = s;
164     sprintf(tmpbuf, "%s found where operator expected", what);
165     yywarn(tmpbuf);
166     if (is_first)
167         warn("\t(Missing semicolon on previous line?)\n");
168     else if (oldoldbufptr && isIDFIRST(*oldoldbufptr)) {
169         char *t;
170         for (t = oldoldbufptr; *t && (isALNUM(*t) || *t == ':'); t++) ;
171         if (t < bufptr && isSPACE(*t))
172             warn("\t(Do you need to predeclare %.*s?)\n",
173                 t - oldoldbufptr, oldoldbufptr);
174
175     }
176     else
177         warn("\t(Missing operator before %.*s?)\n", s - oldbp, oldbp);
178     bufptr = oldbp;
179 }
180
181 static void
182 missingterm(s)
183 char *s;
184 {
185     char tmpbuf[3];
186     char q;
187     if (s) {
188         char *nl = strrchr(s,'\n');
189         if (nl)
190             *nl = '\0';
191     }
192     else if (multi_close < 32 || multi_close == 127) {
193         *tmpbuf = '^';
194         tmpbuf[1] = toCTRL(multi_close);
195         s = "\\n";
196         tmpbuf[2] = '\0';
197         s = tmpbuf;
198     }
199     else {
200         *tmpbuf = multi_close;
201         tmpbuf[1] = '\0';
202         s = tmpbuf;
203     }
204     q = strchr(s,'"') ? '\'' : '"';
205     croak("Can't find string terminator %c%s%c anywhere before EOF",q,s,q);
206 }
207
208 void
209 deprecate(s)
210 char *s;
211 {
212     if (dowarn)
213         warn("Use of %s is deprecated", s);
214 }
215
216 static void
217 depcom()
218 {
219     deprecate("comma-less variable list");
220 }
221
222 void
223 lex_start(line)
224 SV *line;
225 {
226     char *s;
227     STRLEN len;
228
229     SAVEI32(lex_dojoin);
230     SAVEI32(lex_brackets);
231     SAVEI32(lex_fakebrack);
232     SAVEI32(lex_casemods);
233     SAVEI32(lex_starts);
234     SAVEI32(lex_state);
235     SAVESPTR(lex_inpat);
236     SAVEI32(lex_inwhat);
237     SAVEI16(curcop->cop_line);
238     SAVEPPTR(bufptr);
239     SAVEPPTR(bufend);
240     SAVEPPTR(oldbufptr);
241     SAVEPPTR(oldoldbufptr);
242     SAVEPPTR(linestart);
243     SAVESPTR(linestr);
244     SAVEPPTR(lex_brackstack);
245     SAVEPPTR(lex_casestack);
246     SAVEDESTRUCTOR(restore_rsfp, rsfp);
247
248     lex_state = LEX_NORMAL;
249     lex_defer = 0;
250     expect = XSTATE;
251     lex_brackets = 0;
252     lex_fakebrack = 0;
253     New(899, lex_brackstack, 120, char);
254     New(899, lex_casestack, 12, char);
255     SAVEFREEPV(lex_brackstack);
256     SAVEFREEPV(lex_casestack);
257     lex_casemods = 0;
258     *lex_casestack = '\0';
259     lex_dojoin = 0;
260     lex_starts = 0;
261     if (lex_stuff)
262         SvREFCNT_dec(lex_stuff);
263     lex_stuff = Nullsv;
264     if (lex_repl)
265         SvREFCNT_dec(lex_repl);
266     lex_repl = Nullsv;
267     lex_inpat = 0;
268     lex_inwhat = 0;
269     linestr = line;
270     if (SvREADONLY(linestr))
271         linestr = sv_2mortal(newSVsv(linestr));
272     s = SvPV(linestr, len);
273     if (len && s[len-1] != ';') {
274         if (!(SvFLAGS(linestr) & SVs_TEMP))
275             linestr = sv_2mortal(newSVsv(linestr));
276         sv_catpvn(linestr, "\n;", 2);
277     }
278     SvTEMP_off(linestr);
279     oldoldbufptr = oldbufptr = bufptr = linestart = SvPVX(linestr);
280     bufend = bufptr + SvCUR(linestr);
281     SvREFCNT_dec(rs);
282     rs = newSVpv("\n", 1);
283     rsfp = 0;
284 }
285
286 void
287 lex_end()
288 {
289     doextract = FALSE;
290 }
291
292 static void
293 restore_rsfp(f)
294 void *f;
295 {
296     PerlIO *fp = (PerlIO*)f;
297
298     if (rsfp == PerlIO_stdin())
299         PerlIO_clearerr(rsfp);
300     else if (rsfp && (rsfp != fp))
301         PerlIO_close(rsfp);
302     rsfp = fp;
303 }
304
305 static void
306 incline(s)
307 char *s;
308 {
309     char *t;
310     char *n;
311     char ch;
312     int sawline = 0;
313
314     curcop->cop_line++;
315     if (*s++ != '#')
316         return;
317     while (*s == ' ' || *s == '\t') s++;
318     if (strnEQ(s, "line ", 5)) {
319         s += 5;
320         sawline = 1;
321     }
322     if (!isDIGIT(*s))
323         return;
324     n = s;
325     while (isDIGIT(*s))
326         s++;
327     while (*s == ' ' || *s == '\t')
328         s++;
329     if (*s == '"' && (t = strchr(s+1, '"')))
330         s++;
331     else {
332         if (!sawline)
333             return;             /* false alarm */
334         for (t = s; !isSPACE(*t); t++) ;
335     }
336     ch = *t;
337     *t = '\0';
338     if (t - s > 0)
339         curcop->cop_filegv = gv_fetchfile(s);
340     else
341         curcop->cop_filegv = gv_fetchfile(origfilename);
342     *t = ch;
343     curcop->cop_line = atoi(n)-1;
344 }
345
346 static char *
347 skipspace(s)
348 register char *s;
349 {
350     if (lex_formbrack && lex_brackets <= lex_formbrack) {
351         while (s < bufend && (*s == ' ' || *s == '\t'))
352             s++;
353         return s;
354     }
355     for (;;) {
356         STRLEN prevlen;
357         while (s < bufend && isSPACE(*s))
358             s++;
359         if (s < bufend && *s == '#') {
360             while (s < bufend && *s != '\n')
361                 s++;
362             if (s < bufend)
363                 s++;
364         }
365         if (s < bufend || !rsfp || lex_state != LEX_NORMAL)
366             return s;
367         if ((s = filter_gets(linestr, rsfp, (prevlen = SvCUR(linestr)))) == Nullch) {
368             if (minus_n || minus_p) {
369                 sv_setpv(linestr,minus_p ? ";}continue{print" : "");
370                 sv_catpv(linestr,";}");
371                 minus_n = minus_p = 0;
372             }
373             else
374                 sv_setpv(linestr,";");
375             oldoldbufptr = oldbufptr = bufptr = s = linestart = SvPVX(linestr);
376             bufend = SvPVX(linestr) + SvCUR(linestr);
377             if (preprocess && !in_eval)
378                 (void)my_pclose(rsfp);
379             else if ((PerlIO*)rsfp == PerlIO_stdin())
380                 PerlIO_clearerr(rsfp);
381             else
382                 (void)PerlIO_close(rsfp);
383             rsfp = Nullfp;
384             return s;
385         }
386         linestart = bufptr = s + prevlen;
387         bufend = s + SvCUR(linestr);
388         s = bufptr;
389         incline(s);
390         if (perldb && curstash != debstash) {
391             SV *sv = NEWSV(85,0);
392
393             sv_upgrade(sv, SVt_PVMG);
394             sv_setpvn(sv,bufptr,bufend-bufptr);
395             av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
396         }
397     }
398 }
399
400 static void
401 check_uni() {
402     char *s;
403     char ch;
404     char *t;
405
406     if (oldoldbufptr != last_uni)
407         return;
408     while (isSPACE(*last_uni))
409         last_uni++;
410     for (s = last_uni; isALNUM(*s) || *s == '-'; s++) ;
411     if ((t = strchr(s, '(')) && t < bufptr)
412         return;
413     ch = *s;
414     *s = '\0';
415     warn("Warning: Use of \"%s\" without parens is ambiguous", last_uni);
416     *s = ch;
417 }
418
419 #ifdef CRIPPLED_CC
420
421 #undef UNI
422 #define UNI(f) return uni(f,s)
423
424 static int
425 uni(f,s)
426 I32 f;
427 char *s;
428 {
429     yylval.ival = f;
430     expect = XTERM;
431     bufptr = s;
432     last_uni = oldbufptr;
433     last_lop_op = f;
434     if (*s == '(')
435         return FUNC1;
436     s = skipspace(s);
437     if (*s == '(')
438         return FUNC1;
439     else
440         return UNIOP;
441 }
442
443 #endif /* CRIPPLED_CC */
444
445 #define LOP(f,x) return lop(f,x,s)
446
447 static I32
448 lop
449 #ifdef CAN_PROTOTYPE
450    (I32 f, expectation x, char *s)
451 #else
452    (f,x,s)
453 I32 f;
454 expectation x;
455 char *s;
456 #endif /* CAN_PROTOTYPE */
457 {
458     yylval.ival = f;
459     CLINE;
460     expect = x;
461     bufptr = s;
462     last_lop = oldbufptr;
463     last_lop_op = f;
464     if (nexttoke)
465         return LSTOP;
466     if (*s == '(')
467         return FUNC;
468     s = skipspace(s);
469     if (*s == '(')
470         return FUNC;
471     else
472         return LSTOP;
473 }
474
475 static void 
476 force_next(type)
477 I32 type;
478 {
479     nexttype[nexttoke] = type;
480     nexttoke++;
481     if (lex_state != LEX_KNOWNEXT) {
482         lex_defer = lex_state;
483         lex_expect = expect;
484         lex_state = LEX_KNOWNEXT;
485     }
486 }
487
488 static char *
489 force_word(start,token,check_keyword,allow_pack,allow_tick)
490 register char *start;
491 int token;
492 int check_keyword;
493 int allow_pack;
494 int allow_tick;
495 {
496     register char *s;
497     STRLEN len;
498     
499     start = skipspace(start);
500     s = start;
501     if (isIDFIRST(*s) ||
502         (allow_pack && *s == ':') ||
503         (allow_tick && *s == '\'') )
504     {
505         s = scan_word(s, tokenbuf, allow_pack, &len);
506         if (check_keyword && keyword(tokenbuf, len))
507             return start;
508         if (token == METHOD) {
509             s = skipspace(s);
510             if (*s == '(')
511                 expect = XTERM;
512             else {
513                 expect = XOPERATOR;
514                 force_next(')');
515                 force_next('(');
516             }
517         }
518         nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST,0, newSVpv(tokenbuf,0));
519         nextval[nexttoke].opval->op_private |= OPpCONST_BARE;
520         force_next(token);
521     }
522     return s;
523 }
524
525 static void
526 force_ident(s, kind)
527 register char *s;
528 int kind;
529 {
530     if (s && *s) {
531         OP* op = (OP*)newSVOP(OP_CONST, 0, newSVpv(s,0));
532         nextval[nexttoke].opval = op;
533         force_next(WORD);
534         if (kind) {
535             op->op_private = OPpCONST_ENTERED;
536             /* XXX see note in pp_entereval() for why we forgo typo
537                warnings if the symbol must be introduced in an eval.
538                GSAR 96-10-12 */
539             gv_fetchpv(s, in_eval ? GV_ADDMULTI : TRUE,
540                 kind == '$' ? SVt_PV :
541                 kind == '@' ? SVt_PVAV :
542                 kind == '%' ? SVt_PVHV :
543                               SVt_PVGV
544                 );
545         }
546     }
547 }
548
549 static char *
550 force_version(s)
551 char *s;
552 {
553     OP *version = Nullop;
554
555     s = skipspace(s);
556
557     /* default VERSION number -- GBARR */
558
559     if(isDIGIT(*s)) {
560         char *d;
561         int c;
562         for( d=s, c = 1; isDIGIT(*d) || *d == '_' || (*d == '.' && c--); d++);
563         if((*d == ';' || isSPACE(*d)) && *(skipspace(d)) != ',') {
564             s = scan_num(s);
565             /* real VERSION number -- GBARR */
566             version = yylval.opval;
567         }
568     }
569
570     /* NOTE: The parser sees the package name and the VERSION swapped */
571     nextval[nexttoke].opval = version;
572     force_next(WORD); 
573
574     return (s);
575 }
576
577 static SV *
578 q(sv)
579 SV *sv;
580 {
581     register char *s;
582     register char *send;
583     register char *d;
584     STRLEN len;
585
586     if (!SvLEN(sv))
587         return sv;
588
589     s = SvPV_force(sv, len);
590     if (SvIVX(sv) == -1)
591         return sv;
592     send = s + len;
593     while (s < send && *s != '\\')
594         s++;
595     if (s == send)
596         return sv;
597     d = s;
598     while (s < send) {
599         if (*s == '\\') {
600             if (s + 1 < send && (s[1] == '\\'))
601                 s++;            /* all that, just for this */
602         }
603         *d++ = *s++;
604     }
605     *d = '\0';
606     SvCUR_set(sv, d - SvPVX(sv));
607
608     return sv;
609 }
610
611 static I32
612 sublex_start()
613 {
614     register I32 op_type = yylval.ival;
615
616     if (op_type == OP_NULL) {
617         yylval.opval = lex_op;
618         lex_op = Nullop;
619         return THING;
620     }
621     if (op_type == OP_CONST || op_type == OP_READLINE) {
622         yylval.opval = (OP*)newSVOP(op_type, 0, q(lex_stuff));
623         lex_stuff = Nullsv;
624         return THING;
625     }
626
627     sublex_info.super_state = lex_state;
628     sublex_info.sub_inwhat = op_type;
629     sublex_info.sub_op = lex_op;
630     lex_state = LEX_INTERPPUSH;
631
632     expect = XTERM;
633     if (lex_op) {
634         yylval.opval = lex_op;
635         lex_op = Nullop;
636         return PMFUNC;
637     }
638     else
639         return FUNC;
640 }
641
642 static I32
643 sublex_push()
644 {
645     push_scope();
646
647     lex_state = sublex_info.super_state;
648     SAVEI32(lex_dojoin);
649     SAVEI32(lex_brackets);
650     SAVEI32(lex_fakebrack);
651     SAVEI32(lex_casemods);
652     SAVEI32(lex_starts);
653     SAVEI32(lex_state);
654     SAVESPTR(lex_inpat);
655     SAVEI32(lex_inwhat);
656     SAVEI16(curcop->cop_line);
657     SAVEPPTR(bufptr);
658     SAVEPPTR(oldbufptr);
659     SAVEPPTR(oldoldbufptr);
660     SAVEPPTR(linestart);
661     SAVESPTR(linestr);
662     SAVEPPTR(lex_brackstack);
663     SAVEPPTR(lex_casestack);
664
665     linestr = lex_stuff;
666     lex_stuff = Nullsv;
667
668     bufend = bufptr = oldbufptr = oldoldbufptr = linestart = SvPVX(linestr);
669     bufend += SvCUR(linestr);
670     SAVEFREESV(linestr);
671
672     lex_dojoin = FALSE;
673     lex_brackets = 0;
674     lex_fakebrack = 0;
675     New(899, lex_brackstack, 120, char);
676     New(899, lex_casestack, 12, char);
677     SAVEFREEPV(lex_brackstack);
678     SAVEFREEPV(lex_casestack);
679     lex_casemods = 0;
680     *lex_casestack = '\0';
681     lex_starts = 0;
682     lex_state = LEX_INTERPCONCAT;
683     curcop->cop_line = multi_start;
684
685     lex_inwhat = sublex_info.sub_inwhat;
686     if (lex_inwhat == OP_MATCH || lex_inwhat == OP_SUBST)
687         lex_inpat = sublex_info.sub_op;
688     else
689         lex_inpat = Nullop;
690
691     return '(';
692 }
693
694 static I32
695 sublex_done()
696 {
697     if (!lex_starts++) {
698         expect = XOPERATOR;
699         yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv("",0));
700         return THING;
701     }
702
703     if (lex_casemods) {         /* oops, we've got some unbalanced parens */
704         lex_state = LEX_INTERPCASEMOD;
705         return yylex();
706     }
707
708     /* Is there a right-hand side to take care of? */
709     if (lex_repl && (lex_inwhat == OP_SUBST || lex_inwhat == OP_TRANS)) {
710         linestr = lex_repl;
711         lex_inpat = 0;
712         bufend = bufptr = oldbufptr = oldoldbufptr = linestart = SvPVX(linestr);
713         bufend += SvCUR(linestr);
714         SAVEFREESV(linestr);
715         lex_dojoin = FALSE;
716         lex_brackets = 0;
717         lex_fakebrack = 0;
718         lex_casemods = 0;
719         *lex_casestack = '\0';
720         lex_starts = 0;
721         if (SvCOMPILED(lex_repl)) {
722             lex_state = LEX_INTERPNORMAL;
723             lex_starts++;
724         }
725         else
726             lex_state = LEX_INTERPCONCAT;
727         lex_repl = Nullsv;
728         return ',';
729     }
730     else {
731         pop_scope();
732         bufend = SvPVX(linestr);
733         bufend += SvCUR(linestr);
734         expect = XOPERATOR;
735         return ')';
736     }
737 }
738
739 static char *
740 scan_const(start)
741 char *start;
742 {
743     register char *send = bufend;
744     SV *sv = NEWSV(93, send - start);
745     register char *s = start;
746     register char *d = SvPVX(sv);
747     bool dorange = FALSE;
748     I32 len;
749     char *leave =
750         lex_inpat
751             ? "\\.^$@AGZdDwWsSbB+*?|()-nrtfeaxc0123456789[{]} \t\n\r\f\v#"
752             : (lex_inwhat & OP_TRANS)
753                 ? ""
754                 : "";
755
756     while (s < send || dorange) {
757         if (lex_inwhat == OP_TRANS) {
758             if (dorange) {
759                 I32 i;
760                 I32 max;
761                 i = d - SvPVX(sv);
762                 SvGROW(sv, SvLEN(sv) + 256);
763                 d = SvPVX(sv) + i;
764                 d -= 2;
765                 max = (U8)d[1];
766                 for (i = (U8)*d; i <= max; i++)
767                     *d++ = i;
768                 dorange = FALSE;
769                 continue;
770             }
771             else if (*s == '-' && s+1 < send  && s != start) {
772                 dorange = TRUE;
773                 s++;
774             }
775         }
776         else if (*s == '(' && lex_inpat && s[1] == '?' && s[2] == '#') {
777             while (s < send && *s != ')')
778                 *d++ = *s++;
779         }
780         else if (*s == '#' && lex_inpat &&
781           ((PMOP*)lex_inpat)->op_pmflags & PMf_EXTENDED) {
782             while (s+1 < send && *s != '\n')
783                 *d++ = *s++;
784         }
785         else if (*s == '@' && s[1] && (isALNUM(s[1]) || strchr(":'{$", s[1])))
786             break;
787         else if (*s == '$') {
788             if (!lex_inpat)     /* not a regexp, so $ must be var */
789                 break;
790             if (s + 1 < send && !strchr(")| \n\t", s[1]))
791                 break;          /* in regexp, $ might be tail anchor */
792         }
793         if (*s == '\\' && s+1 < send) {
794             s++;
795             if (*s && strchr(leave, *s)) {
796                 *d++ = '\\';
797                 *d++ = *s++;
798                 continue;
799             }
800             if (lex_inwhat == OP_SUBST && !lex_inpat &&
801                 isDIGIT(*s) && *s != '0' && !isDIGIT(s[1]))
802             {
803                 if (dowarn)
804                     warn("\\%c better written as $%c", *s, *s);
805                 *--s = '$';
806                 break;
807             }
808             if (lex_inwhat != OP_TRANS && *s && strchr("lLuUEQ", *s)) {
809                 --s;
810                 break;
811             }
812             switch (*s) {
813             case '-':
814                 if (lex_inwhat == OP_TRANS) {
815                     *d++ = *s++;
816                     continue;
817                 }
818                 /* FALL THROUGH */
819             default:
820                 *d++ = *s++;
821                 continue;
822             case '0': case '1': case '2': case '3':
823             case '4': case '5': case '6': case '7':
824                 *d++ = scan_oct(s, 3, &len);
825                 s += len;
826                 continue;
827             case 'x':
828                 *d++ = scan_hex(++s, 2, &len);
829                 s += len;
830                 continue;
831             case 'c':
832                 s++;
833                 len = *s++;
834                 *d++ = toCTRL(len);
835                 continue;
836             case 'b':
837                 *d++ = '\b';
838                 break;
839             case 'n':
840                 *d++ = '\n';
841                 break;
842             case 'r':
843                 *d++ = '\r';
844                 break;
845             case 'f':
846                 *d++ = '\f';
847                 break;
848             case 't':
849                 *d++ = '\t';
850                 break;
851             case 'e':
852                 *d++ = '\033';
853                 break;
854             case 'a':
855                 *d++ = '\007';
856                 break;
857             }
858             s++;
859             continue;
860         }
861         *d++ = *s++;
862     }
863     *d = '\0';
864     SvCUR_set(sv, d - SvPVX(sv));
865     SvPOK_on(sv);
866
867     if (SvCUR(sv) + 5 < SvLEN(sv)) {
868         SvLEN_set(sv, SvCUR(sv) + 1);
869         Renew(SvPVX(sv), SvLEN(sv), char);
870     }
871     if (s > bufptr)
872         yylval.opval = (OP*)newSVOP(OP_CONST, 0, sv);
873     else
874         SvREFCNT_dec(sv);
875     return s;
876 }
877
878 /* This is the one truly awful dwimmer necessary to conflate C and sed. */
879 static int
880 intuit_more(s)
881 register char *s;
882 {
883     if (lex_brackets)
884         return TRUE;
885     if (*s == '-' && s[1] == '>' && (s[2] == '[' || s[2] == '{'))
886         return TRUE;
887     if (*s != '{' && *s != '[')
888         return FALSE;
889     if (!lex_inpat)
890         return TRUE;
891
892     /* In a pattern, so maybe we have {n,m}. */
893     if (*s == '{') {
894         s++;
895         if (!isDIGIT(*s))
896             return TRUE;
897         while (isDIGIT(*s))
898             s++;
899         if (*s == ',')
900             s++;
901         while (isDIGIT(*s))
902             s++;
903         if (*s == '}')
904             return FALSE;
905         return TRUE;
906         
907     }
908
909     /* On the other hand, maybe we have a character class */
910
911     s++;
912     if (*s == ']' || *s == '^')
913         return FALSE;
914     else {
915         int weight = 2;         /* let's weigh the evidence */
916         char seen[256];
917         unsigned char un_char = 0, last_un_char;
918         char *send = strchr(s,']');
919         char tmpbuf[512];
920
921         if (!send)              /* has to be an expression */
922             return TRUE;
923
924         Zero(seen,256,char);
925         if (*s == '$')
926             weight -= 3;
927         else if (isDIGIT(*s)) {
928             if (s[1] != ']') {
929                 if (isDIGIT(s[1]) && s[2] == ']')
930                     weight -= 10;
931             }
932             else
933                 weight -= 100;
934         }
935         for (; s < send; s++) {
936             last_un_char = un_char;
937             un_char = (unsigned char)*s;
938             switch (*s) {
939             case '@':
940             case '&':
941             case '$':
942                 weight -= seen[un_char] * 10;
943                 if (isALNUM(s[1])) {
944                     scan_ident(s,send,tmpbuf,FALSE);
945                     if ((int)strlen(tmpbuf) > 1 && gv_fetchpv(tmpbuf,FALSE, SVt_PV))
946                         weight -= 100;
947                     else
948                         weight -= 10;
949                 }
950                 else if (*s == '$' && s[1] &&
951                   strchr("[#!%*<>()-=",s[1])) {
952                     if (/*{*/ strchr("])} =",s[2]))
953                         weight -= 10;
954                     else
955                         weight -= 1;
956                 }
957                 break;
958             case '\\':
959                 un_char = 254;
960                 if (s[1]) {
961                     if (strchr("wds]",s[1]))
962                         weight += 100;
963                     else if (seen['\''] || seen['"'])
964                         weight += 1;
965                     else if (strchr("rnftbxcav",s[1]))
966                         weight += 40;
967                     else if (isDIGIT(s[1])) {
968                         weight += 40;
969                         while (s[1] && isDIGIT(s[1]))
970                             s++;
971                     }
972                 }
973                 else
974                     weight += 100;
975                 break;
976             case '-':
977                 if (s[1] == '\\')
978                     weight += 50;
979                 if (strchr("aA01! ",last_un_char))
980                     weight += 30;
981                 if (strchr("zZ79~",s[1]))
982                     weight += 30;
983                 break;
984             default:
985                 if (!isALNUM(last_un_char) && !strchr("$@&",last_un_char) &&
986                         isALPHA(*s) && s[1] && isALPHA(s[1])) {
987                     char *d = tmpbuf;
988                     while (isALPHA(*s))
989                         *d++ = *s++;
990                     *d = '\0';
991                     if (keyword(tmpbuf, d - tmpbuf))
992                         weight -= 150;
993                 }
994                 if (un_char == last_un_char + 1)
995                     weight += 5;
996                 weight -= seen[un_char];
997                 break;
998             }
999             seen[un_char]++;
1000         }
1001         if (weight >= 0)        /* probably a character class */
1002             return FALSE;
1003     }
1004
1005     return TRUE;
1006 }
1007
1008 static int
1009 intuit_method(start,gv)
1010 char *start;
1011 GV *gv;
1012 {
1013     char *s = start + (*start == '$');
1014     char tmpbuf[1024];
1015     STRLEN len;
1016     GV* indirgv;
1017
1018     if (gv) {
1019         if (GvIO(gv))
1020             return 0;
1021         if (!GvCVu(gv))
1022             gv = 0;
1023     }
1024     s = scan_word(s, tmpbuf, TRUE, &len);
1025     if (*start == '$') {
1026         if (gv || last_lop_op == OP_PRINT || isUPPER(*tokenbuf))
1027             return 0;
1028         s = skipspace(s);
1029         bufptr = start;
1030         expect = XREF;
1031         return *s == '(' ? FUNCMETH : METHOD;
1032     }
1033     if (!keyword(tmpbuf, len)) {
1034         indirgv = gv_fetchpv(tmpbuf,FALSE, SVt_PVCV);
1035         if (indirgv && GvCVu(indirgv))
1036             return 0;
1037         /* filehandle or package name makes it a method */
1038         if (!gv || GvIO(indirgv) || gv_stashpvn(tmpbuf, len, FALSE)) {
1039             s = skipspace(s);
1040             if ((bufend - s) >= 2 && *s == '=' && *(s+1) == '>')
1041                 return 0;       /* no assumptions -- "=>" quotes bearword */
1042             nextval[nexttoke].opval =
1043                 (OP*)newSVOP(OP_CONST, 0,
1044                             newSVpv(tmpbuf,0));
1045             nextval[nexttoke].opval->op_private =
1046                 OPpCONST_BARE;
1047             expect = XTERM;
1048             force_next(WORD);
1049             bufptr = s;
1050             return *s == '(' ? FUNCMETH : METHOD;
1051         }
1052     }
1053     return 0;
1054 }
1055
1056 static char*
1057 incl_perldb()
1058 {
1059     if (perldb) {
1060         char *pdb = getenv("PERL5DB");
1061
1062         if (pdb)
1063             return pdb;
1064         return "BEGIN { require 'perl5db.pl' }";
1065     }
1066     return "";
1067 }
1068
1069
1070 /* Encoded script support. filter_add() effectively inserts a
1071  * 'pre-processing' function into the current source input stream. 
1072  * Note that the filter function only applies to the current source file
1073  * (e.g., it will not affect files 'require'd or 'use'd by this one).
1074  *
1075  * The datasv parameter (which may be NULL) can be used to pass
1076  * private data to this instance of the filter. The filter function
1077  * can recover the SV using the FILTER_DATA macro and use it to
1078  * store private buffers and state information.
1079  *
1080  * The supplied datasv parameter is upgraded to a PVIO type
1081  * and the IoDIRP field is used to store the function pointer.
1082  * Note that IoTOP_NAME, IoFMT_NAME, IoBOTTOM_NAME, if set for
1083  * private use must be set using malloc'd pointers.
1084  */
1085 static int filter_debug = 0;
1086
1087 SV *
1088 filter_add(funcp, datasv)
1089     filter_t funcp;
1090     SV *datasv;
1091 {
1092     if (!funcp){ /* temporary handy debugging hack to be deleted */
1093         filter_debug = atoi((char*)datasv);
1094         return NULL;
1095     }
1096     if (!rsfp_filters)
1097         rsfp_filters = newAV();
1098     if (!datasv)
1099         datasv = newSV(0);
1100     if (!SvUPGRADE(datasv, SVt_PVIO))
1101         die("Can't upgrade filter_add data to SVt_PVIO");
1102     IoDIRP(datasv) = (DIR*)funcp; /* stash funcp into spare field */
1103     if (filter_debug)
1104         warn("filter_add func %lx (%s)", funcp, SvPV(datasv,na));
1105     av_unshift(rsfp_filters, 1);
1106     av_store(rsfp_filters, 0, datasv) ;
1107     return(datasv);
1108 }
1109  
1110
1111 /* Delete most recently added instance of this filter function. */
1112 void
1113 filter_del(funcp)
1114     filter_t funcp;
1115 {
1116     if (filter_debug)
1117         warn("filter_del func %lx", funcp);
1118     if (!rsfp_filters || AvFILL(rsfp_filters)<0)
1119         return;
1120     /* if filter is on top of stack (usual case) just pop it off */
1121     if (IoDIRP(FILTER_DATA(0)) == (void*)funcp){
1122         /* sv_free(av_pop(rsfp_filters)); */
1123         sv_free(av_shift(rsfp_filters));
1124
1125         return;
1126     }
1127     /* we need to search for the correct entry and clear it     */
1128     die("filter_del can only delete in reverse order (currently)");
1129 }
1130
1131
1132 /* Invoke the n'th filter function for the current rsfp.         */
1133 I32
1134 filter_read(idx, buf_sv, maxlen)
1135     int idx;
1136     SV *buf_sv;
1137     int maxlen;         /* 0 = read one text line */
1138 {
1139     filter_t funcp;
1140     SV *datasv = NULL;
1141
1142     if (!rsfp_filters)
1143         return -1;
1144     if (idx > AvFILL(rsfp_filters)){       /* Any more filters? */
1145         /* Provide a default input filter to make life easy.    */
1146         /* Note that we append to the line. This is handy.      */
1147         if (filter_debug)
1148             warn("filter_read %d: from rsfp\n", idx);
1149         if (maxlen) { 
1150             /* Want a block */
1151             int len ;
1152             int old_len = SvCUR(buf_sv) ;
1153
1154             /* ensure buf_sv is large enough */
1155             SvGROW(buf_sv, old_len + maxlen) ;
1156             if ((len = PerlIO_read(rsfp, SvPVX(buf_sv) + old_len, maxlen)) <= 0){
1157                 if (PerlIO_error(rsfp))
1158                     return -1;          /* error */
1159                 else
1160                     return 0 ;          /* end of file */
1161             }
1162             SvCUR_set(buf_sv, old_len + len) ;
1163         } else {
1164             /* Want a line */
1165             if (sv_gets(buf_sv, rsfp, SvCUR(buf_sv)) == NULL) {
1166                 if (PerlIO_error(rsfp))
1167                     return -1;          /* error */
1168                 else
1169                     return 0 ;          /* end of file */
1170             }
1171         }
1172         return SvCUR(buf_sv);
1173     }
1174     /* Skip this filter slot if filter has been deleted */
1175     if ( (datasv = FILTER_DATA(idx)) == &sv_undef){
1176         if (filter_debug)
1177             warn("filter_read %d: skipped (filter deleted)\n", idx);
1178         return FILTER_READ(idx+1, buf_sv, maxlen); /* recurse */
1179     }
1180     /* Get function pointer hidden within datasv        */
1181     funcp = (filter_t)IoDIRP(datasv);
1182     if (filter_debug)
1183         warn("filter_read %d: via function %lx (%s)\n",
1184                 idx, funcp, SvPV(datasv,na));
1185     /* Call function. The function is expected to       */
1186     /* call "FILTER_READ(idx+1, buf_sv)" first.         */
1187     /* Return: <0:error, =0:eof, >0:not eof             */
1188     return (*funcp)(idx, buf_sv, maxlen);
1189 }
1190
1191 static char *
1192 filter_gets(sv,fp, append)
1193 register SV *sv;
1194 register PerlIO *fp;
1195 STRLEN append;
1196 {
1197     if (rsfp_filters) {
1198
1199         if (!append)
1200             SvCUR_set(sv, 0);   /* start with empty line        */
1201         if (FILTER_READ(0, sv, 0) > 0)
1202             return ( SvPVX(sv) ) ;
1203         else
1204             return Nullch ;
1205     }
1206     else 
1207         return (sv_gets(sv, fp, append));
1208     
1209 }
1210
1211
1212 #ifdef DEBUGGING
1213     static char* exp_name[] =
1214         { "OPERATOR", "TERM", "REF", "STATE", "BLOCK", "TERMBLOCK" };
1215 #endif
1216
1217 EXT int yychar;         /* last token */
1218
1219 int
1220 yylex()
1221 {
1222     register char *s;
1223     register char *d;
1224     register I32 tmp;
1225     STRLEN len;
1226
1227     if (pending_ident) {
1228         char pit = pending_ident;
1229         pending_ident = 0;
1230
1231         if (in_my) {
1232             if (strchr(tokenbuf,':'))
1233                 croak(no_myglob,tokenbuf);
1234             yylval.opval = newOP(OP_PADANY, 0);
1235             yylval.opval->op_targ = pad_allocmy(tokenbuf);
1236             return PRIVATEREF;
1237         }
1238
1239         if (!strchr(tokenbuf,':') && (tmp = pad_findmy(tokenbuf))) {
1240             if (last_lop_op == OP_SORT &&
1241                 tokenbuf[0] == '$' &&
1242                 (tokenbuf[1] == 'a' || tokenbuf[1] == 'b')
1243                 && !tokenbuf[2])
1244             {
1245                 for (d = in_eval ? oldoldbufptr : linestart;
1246                      d < bufend && *d != '\n';
1247                      d++)
1248                 {
1249                     if (strnEQ(d,"<=>",3) || strnEQ(d,"cmp",3)) {
1250                         croak("Can't use \"my %s\" in sort comparison",
1251                               tokenbuf);
1252                     }
1253                 }
1254             }
1255
1256             yylval.opval = newOP(OP_PADANY, 0);
1257             yylval.opval->op_targ = tmp;
1258             return PRIVATEREF;
1259         }
1260
1261         /* Force them to make up their mind on "@foo". */
1262         if (pit == '@' && lex_state != LEX_NORMAL && !lex_brackets) {
1263             GV *gv = gv_fetchpv(tokenbuf+1, FALSE, SVt_PVAV);
1264             if (!gv || ((tokenbuf[0] == '@') ? !GvAV(gv) : !GvHV(gv))) {
1265                 char tmpbuf[1024];
1266                 sprintf(tmpbuf, "Literal %s now requires backslash", tokenbuf);
1267                 yyerror(tmpbuf);
1268             }
1269         }
1270
1271         yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf+1, 0));
1272         yylval.opval->op_private = OPpCONST_ENTERED;
1273         gv_fetchpv(tokenbuf+1, in_eval ? GV_ADDMULTI : TRUE,
1274                    ((tokenbuf[0] == '$') ? SVt_PV
1275                     : (tokenbuf[0] == '@') ? SVt_PVAV
1276                     : SVt_PVHV));
1277         return WORD;
1278     }
1279
1280     switch (lex_state) {
1281 #ifdef COMMENTARY
1282     case LEX_NORMAL:            /* Some compilers will produce faster */
1283     case LEX_INTERPNORMAL:      /* code if we comment these out. */
1284         break;
1285 #endif
1286
1287     case LEX_KNOWNEXT:
1288         nexttoke--;
1289         yylval = nextval[nexttoke];
1290         if (!nexttoke) {
1291             lex_state = lex_defer;
1292             expect = lex_expect;
1293             lex_defer = LEX_NORMAL;
1294         }
1295         return(nexttype[nexttoke]);
1296
1297     case LEX_INTERPCASEMOD:
1298 #ifdef DEBUGGING
1299         if (bufptr != bufend && *bufptr != '\\')
1300             croak("panic: INTERPCASEMOD");
1301 #endif
1302         if (bufptr == bufend || bufptr[1] == 'E') {
1303             char oldmod;
1304             if (lex_casemods) {
1305                 oldmod = lex_casestack[--lex_casemods];
1306                 lex_casestack[lex_casemods] = '\0';
1307                 if (bufptr != bufend && strchr("LUQ", oldmod)) {
1308                     bufptr += 2;
1309                     lex_state = LEX_INTERPCONCAT;
1310                 }
1311                 return ')';
1312             }
1313             if (bufptr != bufend)
1314                 bufptr += 2;
1315             lex_state = LEX_INTERPCONCAT;
1316             return yylex();
1317         }
1318         else {
1319             s = bufptr + 1;
1320             if (strnEQ(s, "L\\u", 3) || strnEQ(s, "U\\l", 3))
1321                 tmp = *s, *s = s[2], s[2] = tmp;        /* misordered... */
1322             if (strchr("LU", *s) &&
1323                 (strchr(lex_casestack, 'L') || strchr(lex_casestack, 'U')))
1324             {
1325                 lex_casestack[--lex_casemods] = '\0';
1326                 return ')';
1327             }
1328             if (lex_casemods > 10) {
1329                 char* newlb = Renew(lex_casestack, lex_casemods + 2, char);
1330                 if (newlb != lex_casestack) {
1331                     SAVEFREEPV(newlb);
1332                     lex_casestack = newlb;
1333                 }
1334             }
1335             lex_casestack[lex_casemods++] = *s;
1336             lex_casestack[lex_casemods] = '\0';
1337             lex_state = LEX_INTERPCONCAT;
1338             nextval[nexttoke].ival = 0;
1339             force_next('(');
1340             if (*s == 'l')
1341                 nextval[nexttoke].ival = OP_LCFIRST;
1342             else if (*s == 'u')
1343                 nextval[nexttoke].ival = OP_UCFIRST;
1344             else if (*s == 'L')
1345                 nextval[nexttoke].ival = OP_LC;
1346             else if (*s == 'U')
1347                 nextval[nexttoke].ival = OP_UC;
1348             else if (*s == 'Q')
1349                 nextval[nexttoke].ival = OP_QUOTEMETA;
1350             else
1351                 croak("panic: yylex");
1352             bufptr = s + 1;
1353             force_next(FUNC);
1354             if (lex_starts) {
1355                 s = bufptr;
1356                 lex_starts = 0;
1357                 Aop(OP_CONCAT);
1358             }
1359             else
1360                 return yylex();
1361         }
1362
1363     case LEX_INTERPPUSH:
1364         return sublex_push();
1365
1366     case LEX_INTERPSTART:
1367         if (bufptr == bufend)
1368             return sublex_done();
1369         expect = XTERM;
1370         lex_dojoin = (*bufptr == '@');
1371         lex_state = LEX_INTERPNORMAL;
1372         if (lex_dojoin) {
1373             nextval[nexttoke].ival = 0;
1374             force_next(',');
1375             force_ident("\"", '$');
1376             nextval[nexttoke].ival = 0;
1377             force_next('$');
1378             nextval[nexttoke].ival = 0;
1379             force_next('(');
1380             nextval[nexttoke].ival = OP_JOIN;   /* emulate join($", ...) */
1381             force_next(FUNC);
1382         }
1383         if (lex_starts++) {
1384             s = bufptr;
1385             Aop(OP_CONCAT);
1386         }
1387         else
1388             return yylex();
1389         break;
1390
1391     case LEX_INTERPENDMAYBE:
1392         if (intuit_more(bufptr)) {
1393             lex_state = LEX_INTERPNORMAL;       /* false alarm, more expr */
1394             break;
1395         }
1396         /* FALL THROUGH */
1397
1398     case LEX_INTERPEND:
1399         if (lex_dojoin) {
1400             lex_dojoin = FALSE;
1401             lex_state = LEX_INTERPCONCAT;
1402             return ')';
1403         }
1404         /* FALLTHROUGH */
1405     case LEX_INTERPCONCAT:
1406 #ifdef DEBUGGING
1407         if (lex_brackets)
1408             croak("panic: INTERPCONCAT");
1409 #endif
1410         if (bufptr == bufend)
1411             return sublex_done();
1412
1413         if (SvIVX(linestr) == '\'') {
1414             SV *sv = newSVsv(linestr);
1415             if (!lex_inpat)
1416                 sv = q(sv);
1417             yylval.opval = (OP*)newSVOP(OP_CONST, 0, sv);
1418             s = bufend;
1419         }
1420         else {
1421             s = scan_const(bufptr);
1422             if (*s == '\\')
1423                 lex_state = LEX_INTERPCASEMOD;
1424             else
1425                 lex_state = LEX_INTERPSTART;
1426         }
1427
1428         if (s != bufptr) {
1429             nextval[nexttoke] = yylval;
1430             expect = XTERM;
1431             force_next(THING);
1432             if (lex_starts++)
1433                 Aop(OP_CONCAT);
1434             else {
1435                 bufptr = s;
1436                 return yylex();
1437             }
1438         }
1439
1440         return yylex();
1441     case LEX_FORMLINE:
1442         lex_state = LEX_NORMAL;
1443         s = scan_formline(bufptr);
1444         if (!lex_formbrack)
1445             goto rightbracket;
1446         OPERATOR(';');
1447     }
1448
1449     s = bufptr;
1450     oldoldbufptr = oldbufptr;
1451     oldbufptr = s;
1452     DEBUG_p( {
1453         PerlIO_printf(PerlIO_stderr(), "### Tokener expecting %s at %s\n", exp_name[expect], s);
1454     } )
1455
1456   retry:
1457     switch (*s) {
1458     default:
1459         warn("Unrecognized character \\%03o ignored", *s++ & 255);
1460         goto retry;
1461     case 4:
1462     case 26:
1463         goto fake_eof;                  /* emulate EOF on ^D or ^Z */
1464     case 0:
1465         if (!rsfp) {
1466             last_uni = 0;
1467             last_lop = 0;
1468             if (lex_brackets)
1469                 yyerror("Missing right bracket");
1470             TOKEN(0);
1471         }
1472         if (s++ < bufend)
1473             goto retry;                 /* ignore stray nulls */
1474         last_uni = 0;
1475         last_lop = 0;
1476         if (!in_eval && !preambled) {
1477             preambled = TRUE;
1478             sv_setpv(linestr,incl_perldb());
1479             if (SvCUR(linestr))
1480                 sv_catpv(linestr,";");
1481             if (preambleav){
1482                 while(AvFILL(preambleav) >= 0) {
1483                     SV *tmpsv = av_shift(preambleav);
1484                     sv_catsv(linestr, tmpsv);
1485                     sv_catpv(linestr, ";");
1486                     sv_free(tmpsv);
1487                 }
1488                 sv_free((SV*)preambleav);
1489                 preambleav = NULL;
1490             }
1491             if (minus_n || minus_p) {
1492                 sv_catpv(linestr, "LINE: while (<>) {");
1493                 if (minus_l)
1494                     sv_catpv(linestr,"chomp;");
1495                 if (minus_a){
1496                     if (minus_F){
1497                       char tmpbuf1[50];
1498                       if ( splitstr[0] == '/' || 
1499                            splitstr[0] == '\'' || 
1500                            splitstr[0] == '"' )
1501                             sprintf( tmpbuf1, "@F=split(%s);", splitstr );
1502                         else
1503                             sprintf( tmpbuf1, "@F=split('%s');", splitstr );
1504                         sv_catpv(linestr,tmpbuf1);
1505                     }
1506                     else
1507                         sv_catpv(linestr,"@F=split(' ');");
1508                 }
1509             }
1510             sv_catpv(linestr, "\n");
1511             oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1512             bufend = SvPVX(linestr) + SvCUR(linestr);
1513             if (perldb && curstash != debstash) {
1514                 SV *sv = NEWSV(85,0);
1515
1516                 sv_upgrade(sv, SVt_PVMG);
1517                 sv_setsv(sv,linestr);
1518                 av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
1519             }
1520             goto retry;
1521         }
1522         do {
1523             if ((s = filter_gets(linestr, rsfp, 0)) == Nullch) {
1524               fake_eof:
1525                 if (rsfp) {
1526                     if (preprocess && !in_eval)
1527                         (void)my_pclose(rsfp);
1528                     else if ((PerlIO *)rsfp == PerlIO_stdin())
1529                         PerlIO_clearerr(rsfp);
1530                     else
1531                         (void)PerlIO_close(rsfp);
1532                     rsfp = Nullfp;
1533                 }
1534                 if (!in_eval && (minus_n || minus_p)) {
1535                     sv_setpv(linestr,minus_p ? ";}continue{print" : "");
1536                     sv_catpv(linestr,";}");
1537                     oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1538                     bufend = SvPVX(linestr) + SvCUR(linestr);
1539                     minus_n = minus_p = 0;
1540                     goto retry;
1541                 }
1542                 oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1543                 sv_setpv(linestr,"");
1544                 TOKEN(';');     /* not infinite loop because rsfp is NULL now */
1545             }
1546             if (doextract) {
1547                 if (*s == '#' && s[1] == '!' && instr(s,"perl"))
1548                     doextract = FALSE;
1549
1550                 /* Incest with pod. */
1551                 if (*s == '=' && strnEQ(s, "=cut", 4)) {
1552                     sv_setpv(linestr, "");
1553                     oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1554                     bufend = SvPVX(linestr) + SvCUR(linestr);
1555                     doextract = FALSE;
1556                 }
1557             }
1558             incline(s);
1559         } while (doextract);
1560         oldoldbufptr = oldbufptr = bufptr = linestart = s;
1561         if (perldb && curstash != debstash) {
1562             SV *sv = NEWSV(85,0);
1563
1564             sv_upgrade(sv, SVt_PVMG);
1565             sv_setsv(sv,linestr);
1566             av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
1567         }
1568         bufend = SvPVX(linestr) + SvCUR(linestr);
1569         if (curcop->cop_line == 1) {
1570             while (s < bufend && isSPACE(*s))
1571                 s++;
1572             if (*s == ':' && s[1] != ':') /* for csh execing sh scripts */
1573                 s++;
1574             d = Nullch;
1575             if (!in_eval) {
1576                 if (*s == '#' && *(s+1) == '!')
1577                     d = s + 2;
1578 #ifdef ALTERNATE_SHEBANG
1579                 else {
1580                     static char as[] = ALTERNATE_SHEBANG;
1581                     if (*s == as[0] && strnEQ(s, as, sizeof(as) - 1))
1582                         d = s + (sizeof(as) - 1);
1583                 }
1584 #endif /* ALTERNATE_SHEBANG */
1585             }
1586             if (d) {
1587                 char *ipath;
1588                 char *ipathend;
1589
1590                 while (isSPACE(*d))
1591                     d++;
1592                 ipath = d;
1593                 while (*d && !isSPACE(*d))
1594                     d++;
1595                 ipathend = d;
1596
1597 #ifdef ARG_ZERO_IS_SCRIPT
1598                 if (ipathend > ipath) {
1599                     /*
1600                      * HP-UX (at least) sets argv[0] to the script name,
1601                      * which makes $^X incorrect.  And Digital UNIX and Linux,
1602                      * at least, set argv[0] to the basename of the Perl
1603                      * interpreter. So, having found "#!", we'll set it right.
1604                      */
1605                     SV *x = GvSV(gv_fetchpv("\030", TRUE, SVt_PV));
1606                     assert(SvPOK(x) || SvGMAGICAL(x));
1607                     if (sv_eq(x, GvSV(curcop->cop_filegv)))
1608                         sv_setpvn(x, ipath, ipathend - ipath);
1609                     TAINT_NOT;  /* $^X is always tainted, but that's OK */
1610                 }
1611 #endif /* ARG_ZERO_IS_SCRIPT */
1612
1613                 /*
1614                  * Look for options.
1615                  */
1616                 d = instr(s,"perl -");
1617                 if (!d)
1618                     d = instr(s,"perl");
1619 #ifdef ALTERNATE_SHEBANG
1620                 /*
1621                  * If the ALTERNATE_SHEBANG on this system starts with a
1622                  * character that can be part of a Perl expression, then if
1623                  * we see it but not "perl", we're probably looking at the
1624                  * start of Perl code, not a request to hand off to some
1625                  * other interpreter.  Similarly, if "perl" is there, but
1626                  * not in the first 'word' of the line, we assume the line
1627                  * contains the start of the Perl program.
1628                  */
1629                 if (d && *s != '#') {
1630                     char *c = ipath;
1631                     while (*c && !strchr("; \t\r\n\f\v#", *c))
1632                         c++;
1633                     if (c < d)
1634                         d = Nullch;     /* "perl" not in first word; ignore */
1635                     else
1636                         *s = '#';       /* Don't try to parse shebang line */
1637                 }
1638 #endif /* ALTERNATE_SHEBANG */
1639                 if (!d &&
1640                     *s == '#' &&
1641                     ipathend > ipath &&
1642                     !minus_c &&
1643                     !instr(s,"indir") &&
1644                     instr(origargv[0],"perl"))
1645                 {
1646                     char **newargv;
1647
1648                     *ipathend = '\0';
1649                     s = ipathend + 1;
1650                     while (s < bufend && isSPACE(*s))
1651                         s++;
1652                     if (s < bufend) {
1653                         Newz(899,newargv,origargc+3,char*);
1654                         newargv[1] = s;
1655                         while (s < bufend && !isSPACE(*s))
1656                             s++;
1657                         *s = '\0';
1658                         Copy(origargv+1, newargv+2, origargc+1, char*);
1659                     }
1660                     else
1661                         newargv = origargv;
1662                     newargv[0] = ipath;
1663                     execv(ipath, newargv);
1664                     croak("Can't exec %s", ipath);
1665                 }
1666                 if (d) {
1667                     int oldpdb = perldb;
1668                     int oldn = minus_n;
1669                     int oldp = minus_p;
1670
1671                     while (*d && !isSPACE(*d)) d++;
1672                     while (*d == ' ' || *d == '\t') d++;
1673
1674                     if (*d++ == '-') {
1675                         while (d = moreswitches(d)) ;
1676                         if (perldb && !oldpdb ||
1677                             ( minus_n || minus_p ) && !(oldn || oldp) )
1678                               /* if we have already added "LINE: while (<>) {",
1679                                  we must not do it again */
1680                         {
1681                             sv_setpv(linestr, "");
1682                             oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1683                             bufend = SvPVX(linestr) + SvCUR(linestr);
1684                             preambled = FALSE;
1685                             if (perldb)
1686                                 (void)gv_fetchfile(origfilename);
1687                             goto retry;
1688                         }
1689                     }
1690                 }
1691             }
1692         }
1693         if (lex_formbrack && lex_brackets <= lex_formbrack) {
1694             bufptr = s;
1695             lex_state = LEX_FORMLINE;
1696             return yylex();
1697         }
1698         goto retry;
1699     case '\r':
1700         croak("Illegal character \\%03o (carriage return)");
1701     case ' ': case '\t': case '\f': case 013:
1702         s++;
1703         goto retry;
1704     case '#':
1705     case '\n':
1706         if (lex_state != LEX_NORMAL || (in_eval && !rsfp)) {
1707             d = bufend;
1708             while (s < d && *s != '\n')
1709                 s++;
1710             if (s < d)
1711                 s++;
1712             incline(s);
1713             if (lex_formbrack && lex_brackets <= lex_formbrack) {
1714                 bufptr = s;
1715                 lex_state = LEX_FORMLINE;
1716                 return yylex();
1717             }
1718         }
1719         else {
1720             *s = '\0';
1721             bufend = s;
1722         }
1723         goto retry;
1724     case '-':
1725         if (s[1] && isALPHA(s[1]) && !isALNUM(s[2])) {
1726             s++;
1727             bufptr = s;
1728             tmp = *s++;
1729
1730             while (s < bufend && (*s == ' ' || *s == '\t'))
1731                 s++;
1732
1733             if (strnEQ(s,"=>",2)) {
1734                 if (dowarn)
1735                     warn("Ambiguous use of -%c => resolved to \"-%c\" =>",
1736                         tmp, tmp);
1737                 s = force_word(bufptr,WORD,FALSE,FALSE,FALSE);
1738                 OPERATOR('-');          /* unary minus */
1739             }
1740             last_uni = oldbufptr;
1741             last_lop_op = OP_FTEREAD;   /* good enough */
1742             switch (tmp) {
1743             case 'r': FTST(OP_FTEREAD);
1744             case 'w': FTST(OP_FTEWRITE);
1745             case 'x': FTST(OP_FTEEXEC);
1746             case 'o': FTST(OP_FTEOWNED);
1747             case 'R': FTST(OP_FTRREAD);
1748             case 'W': FTST(OP_FTRWRITE);
1749             case 'X': FTST(OP_FTREXEC);
1750             case 'O': FTST(OP_FTROWNED);
1751             case 'e': FTST(OP_FTIS);
1752             case 'z': FTST(OP_FTZERO);
1753             case 's': FTST(OP_FTSIZE);
1754             case 'f': FTST(OP_FTFILE);
1755             case 'd': FTST(OP_FTDIR);
1756             case 'l': FTST(OP_FTLINK);
1757             case 'p': FTST(OP_FTPIPE);
1758             case 'S': FTST(OP_FTSOCK);
1759             case 'u': FTST(OP_FTSUID);
1760             case 'g': FTST(OP_FTSGID);
1761             case 'k': FTST(OP_FTSVTX);
1762             case 'b': FTST(OP_FTBLK);
1763             case 'c': FTST(OP_FTCHR);
1764             case 't': FTST(OP_FTTTY);
1765             case 'T': FTST(OP_FTTEXT);
1766             case 'B': FTST(OP_FTBINARY);
1767             case 'M': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTMTIME);
1768             case 'A': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTATIME);
1769             case 'C': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTCTIME);
1770             default:
1771                 croak("Unrecognized file test: -%c", tmp);
1772                 break;
1773             }
1774         }
1775         tmp = *s++;
1776         if (*s == tmp) {
1777             s++;
1778             if (expect == XOPERATOR)
1779                 TERM(POSTDEC);
1780             else
1781                 OPERATOR(PREDEC);
1782         }
1783         else if (*s == '>') {
1784             s++;
1785             s = skipspace(s);
1786             if (isIDFIRST(*s)) {
1787                 s = force_word(s,METHOD,FALSE,TRUE,FALSE);
1788                 TOKEN(ARROW);
1789             }
1790             else if (*s == '$')
1791                 OPERATOR(ARROW);
1792             else
1793                 TERM(ARROW);
1794         }
1795         if (expect == XOPERATOR)
1796             Aop(OP_SUBTRACT);
1797         else {
1798             if (isSPACE(*s) || !isSPACE(*bufptr))
1799                 check_uni();
1800             OPERATOR('-');              /* unary minus */
1801         }
1802
1803     case '+':
1804         tmp = *s++;
1805         if (*s == tmp) {
1806             s++;
1807             if (expect == XOPERATOR)
1808                 TERM(POSTINC);
1809             else
1810                 OPERATOR(PREINC);
1811         }
1812         if (expect == XOPERATOR)
1813             Aop(OP_ADD);
1814         else {
1815             if (isSPACE(*s) || !isSPACE(*bufptr))
1816                 check_uni();
1817             OPERATOR('+');
1818         }
1819
1820     case '*':
1821         if (expect != XOPERATOR) {
1822             s = scan_ident(s, bufend, tokenbuf, TRUE);
1823             expect = XOPERATOR;
1824             force_ident(tokenbuf, '*');
1825             if (!*tokenbuf)
1826                 PREREF('*');
1827             TERM('*');
1828         }
1829         s++;
1830         if (*s == '*') {
1831             s++;
1832             PWop(OP_POW);
1833         }
1834         Mop(OP_MULTIPLY);
1835
1836     case '%':
1837         if (expect == XOPERATOR) {
1838             ++s;
1839             Mop(OP_MODULO);
1840         }
1841         tokenbuf[0] = '%';
1842         s = scan_ident(s, bufend, tokenbuf+1, TRUE);
1843         if (!tokenbuf[1]) {
1844             if (s == bufend)
1845                 yyerror("Final % should be \\% or %name");
1846             PREREF('%');
1847         }
1848         pending_ident = '%';
1849         TERM('%');
1850
1851     case '^':
1852         s++;
1853         BOop(OP_BIT_XOR);
1854     case '[':
1855         lex_brackets++;
1856         /* FALL THROUGH */
1857     case '~':
1858     case ',':
1859         tmp = *s++;
1860         OPERATOR(tmp);
1861     case ':':
1862         if (s[1] == ':') {
1863             len = 0;
1864             goto just_a_word;
1865         }
1866         s++;
1867         OPERATOR(':');
1868     case '(':
1869         s++;
1870         if (last_lop == oldoldbufptr || last_uni == oldoldbufptr)
1871             oldbufptr = oldoldbufptr;           /* allow print(STDOUT 123) */
1872         else
1873             expect = XTERM;
1874         TOKEN('(');
1875     case ';':
1876         if (curcop->cop_line < copline)
1877             copline = curcop->cop_line;
1878         tmp = *s++;
1879         OPERATOR(tmp);
1880     case ')':
1881         tmp = *s++;
1882         s = skipspace(s);
1883         if (*s == '{')
1884             PREBLOCK(tmp);
1885         TERM(tmp);
1886     case ']':
1887         s++;
1888         if (lex_brackets <= 0)
1889             yyerror("Unmatched right bracket");
1890         else
1891             --lex_brackets;
1892         if (lex_state == LEX_INTERPNORMAL) {
1893             if (lex_brackets == 0) {
1894                 if (*s != '[' && *s != '{' && (*s != '-' || s[1] != '>'))
1895                     lex_state = LEX_INTERPEND;
1896             }
1897         }
1898         TERM(']');
1899     case '{':
1900       leftbracket:
1901         s++;
1902         if (lex_brackets > 100) {
1903             char* newlb = Renew(lex_brackstack, lex_brackets + 1, char);
1904             if (newlb != lex_brackstack) {
1905                 SAVEFREEPV(newlb);
1906                 lex_brackstack = newlb;
1907             }
1908         }
1909         switch (expect) {
1910         case XTERM:
1911             if (lex_formbrack) {
1912                 s--;
1913                 PRETERMBLOCK(DO);
1914             }
1915             if (oldoldbufptr == last_lop)
1916                 lex_brackstack[lex_brackets++] = XTERM;
1917             else
1918                 lex_brackstack[lex_brackets++] = XOPERATOR;
1919             OPERATOR(HASHBRACK);
1920             break;
1921         case XOPERATOR:
1922             while (s < bufend && (*s == ' ' || *s == '\t'))
1923                 s++;
1924             d = s;
1925             tokenbuf[0] = '\0';
1926             if (d < bufend && *d == '-') {
1927                 tokenbuf[0] = '-';
1928                 d++;
1929                 while (d < bufend && (*d == ' ' || *d == '\t'))
1930                     d++;
1931             }
1932             if (d < bufend && isIDFIRST(*d)) {
1933                 d = scan_word(d, tokenbuf + 1, FALSE, &len);
1934                 while (d < bufend && (*d == ' ' || *d == '\t'))
1935                     d++;
1936                 if (*d == '}') {
1937                     char minus = (tokenbuf[0] == '-');
1938                     if (dowarn &&
1939                         (keyword(tokenbuf + 1, len) ||
1940                          (minus && len == 1 && isALPHA(tokenbuf[1])) ||
1941                          perl_get_cv(tokenbuf + 1, FALSE) ))
1942                         warn("Ambiguous use of {%s} resolved to {\"%s\"}",
1943                              tokenbuf + !minus, tokenbuf + !minus);
1944                     s = force_word(s + minus, WORD, FALSE, TRUE, FALSE);
1945                     if (minus)
1946                         force_next('-');
1947                 }
1948             }
1949             /* FALL THROUGH */
1950         case XBLOCK:
1951             lex_brackstack[lex_brackets++] = XSTATE;
1952             expect = XSTATE;
1953             break;
1954         case XTERMBLOCK:
1955             lex_brackstack[lex_brackets++] = XOPERATOR;
1956             expect = XSTATE;
1957             break;
1958         default: {
1959                 char *t;
1960                 if (oldoldbufptr == last_lop)
1961                     lex_brackstack[lex_brackets++] = XTERM;
1962                 else
1963                     lex_brackstack[lex_brackets++] = XOPERATOR;
1964                 s = skipspace(s);
1965                 if (*s == '}')
1966                     OPERATOR(HASHBRACK);
1967                 if (isALPHA(*s)) {
1968                     for (t = s; t < bufend && isALNUM(*t); t++) ;
1969                 }
1970                 else if (*s == '\'' || *s == '"') {
1971                     t = strchr(s+1,*s);
1972                     if (!t++)
1973                         t = s;
1974                 }
1975                 else
1976                     t = s;
1977                 while (t < bufend && isSPACE(*t))
1978                     t++;
1979                 if ((*t == ',' && !isLOWER(*s)) || (*t == '=' && t[1] == '>'))
1980                     OPERATOR(HASHBRACK);
1981                 if (expect == XREF)
1982                     expect = XTERM;
1983                 else {
1984                     lex_brackstack[lex_brackets-1] = XSTATE;
1985                     expect = XSTATE;
1986                 }
1987             }
1988             break;
1989         }
1990         yylval.ival = curcop->cop_line;
1991         if (isSPACE(*s) || *s == '#')
1992             copline = NOLINE;   /* invalidate current command line number */
1993         TOKEN('{');
1994     case '}':
1995       rightbracket:
1996         s++;
1997         if (lex_brackets <= 0)
1998             yyerror("Unmatched right bracket");
1999         else
2000             expect = (expectation)lex_brackstack[--lex_brackets];
2001         if (lex_brackets < lex_formbrack)
2002             lex_formbrack = 0;
2003         if (lex_state == LEX_INTERPNORMAL) {
2004             if (lex_brackets == 0) {
2005                 if (lex_fakebrack) {
2006                     lex_state = LEX_INTERPEND;
2007                     bufptr = s;
2008                     return yylex();             /* ignore fake brackets */
2009                 }
2010                 if (*s == '-' && s[1] == '>')
2011                     lex_state = LEX_INTERPENDMAYBE;
2012                 else if (*s != '[' && *s != '{')
2013                     lex_state = LEX_INTERPEND;
2014             }
2015         }
2016         if (lex_brackets < lex_fakebrack) {
2017             bufptr = s;
2018             lex_fakebrack = 0;
2019             return yylex();             /* ignore fake brackets */
2020         }
2021         force_next('}');
2022         TOKEN(';');
2023     case '&':
2024         s++;
2025         tmp = *s++;
2026         if (tmp == '&')
2027             AOPERATOR(ANDAND);
2028         s--;
2029         if (expect == XOPERATOR) {
2030             if (dowarn && isALPHA(*s) && bufptr == linestart) {
2031                 curcop->cop_line--;
2032                 warn(warn_nosemi);
2033                 curcop->cop_line++;
2034             }
2035             BAop(OP_BIT_AND);
2036         }
2037
2038         s = scan_ident(s-1, bufend, tokenbuf, TRUE);
2039         if (*tokenbuf) {
2040             expect = XOPERATOR;
2041             force_ident(tokenbuf, '&');
2042         }
2043         else
2044             PREREF('&');
2045         yylval.ival = (OPpENTERSUB_AMPER<<8);
2046         TERM('&');
2047
2048     case '|':
2049         s++;
2050         tmp = *s++;
2051         if (tmp == '|')
2052             AOPERATOR(OROR);
2053         s--;
2054         BOop(OP_BIT_OR);
2055     case '=':
2056         s++;
2057         tmp = *s++;
2058         if (tmp == '=')
2059             Eop(OP_EQ);
2060         if (tmp == '>')
2061             OPERATOR(',');
2062         if (tmp == '~')
2063             PMop(OP_MATCH);
2064         if (dowarn && tmp && isSPACE(*s) && strchr("+-*/%.^&|<",tmp))
2065             warn("Reversed %c= operator",tmp);
2066         s--;
2067         if (expect == XSTATE && isALPHA(tmp) &&
2068                 (s == linestart+1 || s[-2] == '\n') )
2069         {
2070             if (in_eval && !rsfp) {
2071                 d = bufend;
2072                 while (s < d) {
2073                     if (*s++ == '\n') {
2074                         incline(s);
2075                         if (strnEQ(s,"=cut",4)) {
2076                             s = strchr(s,'\n');
2077                             if (s)
2078                                 s++;
2079                             else
2080                                 s = d;
2081                             incline(s);
2082                             goto retry;
2083                         }
2084                     }
2085                 }
2086                 goto retry;
2087             }
2088             s = bufend;
2089             doextract = TRUE;
2090             goto retry;
2091         }
2092         if (lex_brackets < lex_formbrack) {
2093             char *t;
2094             for (t = s; *t == ' ' || *t == '\t'; t++) ;
2095             if (*t == '\n' || *t == '#') {
2096                 s--;
2097                 expect = XBLOCK;
2098                 goto leftbracket;
2099             }
2100         }
2101         yylval.ival = 0;
2102         OPERATOR(ASSIGNOP);
2103     case '!':
2104         s++;
2105         tmp = *s++;
2106         if (tmp == '=')
2107             Eop(OP_NE);
2108         if (tmp == '~')
2109             PMop(OP_NOT);
2110         s--;
2111         OPERATOR('!');
2112     case '<':
2113         if (expect != XOPERATOR) {
2114             if (s[1] != '<' && !strchr(s,'>'))
2115                 check_uni();
2116             if (s[1] == '<')
2117                 s = scan_heredoc(s);
2118             else
2119                 s = scan_inputsymbol(s);
2120             TERM(sublex_start());
2121         }
2122         s++;
2123         tmp = *s++;
2124         if (tmp == '<')
2125             SHop(OP_LEFT_SHIFT);
2126         if (tmp == '=') {
2127             tmp = *s++;
2128             if (tmp == '>')
2129                 Eop(OP_NCMP);
2130             s--;
2131             Rop(OP_LE);
2132         }
2133         s--;
2134         Rop(OP_LT);
2135     case '>':
2136         s++;
2137         tmp = *s++;
2138         if (tmp == '>')
2139             SHop(OP_RIGHT_SHIFT);
2140         if (tmp == '=')
2141             Rop(OP_GE);
2142         s--;
2143         Rop(OP_GT);
2144
2145     case '$':
2146         CLINE;
2147
2148         if (expect == XOPERATOR) {
2149             if (lex_formbrack && lex_brackets == lex_formbrack) {
2150                 expect = XTERM;
2151                 depcom();
2152                 return ','; /* grandfather non-comma-format format */
2153             }
2154         }
2155
2156         if (s[1] == '#' && (isALPHA(s[2]) || strchr("_{$:", s[2]))) {
2157             if (expect == XOPERATOR)
2158                 no_op("Array length", bufptr);
2159             tokenbuf[0] = '@';
2160             s = scan_ident(s+1, bufend, tokenbuf+1, FALSE);
2161             if (!tokenbuf[1])
2162                 PREREF(DOLSHARP);
2163             expect = XOPERATOR;
2164             pending_ident = '#';
2165             TOKEN(DOLSHARP);
2166         }
2167
2168         if (expect == XOPERATOR)
2169             no_op("Scalar", bufptr);
2170         tokenbuf[0] = '$';
2171         s = scan_ident(s, bufend, tokenbuf+1, FALSE);
2172         if (!tokenbuf[1]) {
2173             if (s == bufend)
2174                 yyerror("Final $ should be \\$ or $name");
2175             PREREF('$');
2176         }
2177
2178         /* This kludge not intended to be bulletproof. */
2179         if (tokenbuf[1] == '[' && !tokenbuf[2]) {
2180             yylval.opval = newSVOP(OP_CONST, 0,
2181                                    newSViv((IV)compiling.cop_arybase));
2182             yylval.opval->op_private = OPpCONST_ARYBASE;
2183             TERM(THING);
2184         }
2185
2186         d = s;
2187         if (lex_state == LEX_NORMAL)
2188             s = skipspace(s);
2189
2190         if ((expect != XREF || oldoldbufptr == last_lop) && intuit_more(s)) {
2191             char *t;
2192             if (*s == '[') {
2193                 tokenbuf[0] = '@';
2194                 if (dowarn) {
2195                     for(t = s + 1;
2196                         isSPACE(*t) || isALNUM(*t) || *t == '$';
2197                         t++) ;
2198                     if (*t++ == ',') {
2199                         bufptr = skipspace(bufptr);
2200                         while (t < bufend && *t != ']')
2201                             t++;
2202                         warn("Multidimensional syntax %.*s not supported",
2203                              (t - bufptr) + 1, bufptr);
2204                     }
2205                 }
2206             }
2207             else if (*s == '{') {
2208                 tokenbuf[0] = '%';
2209                 if (dowarn && strEQ(tokenbuf+1, "SIG") &&
2210                     (t = strchr(s, '}')) && (t = strchr(t, '=')))
2211                 {
2212                     char tmpbuf[1024];
2213                     STRLEN len;
2214                     for (t++; isSPACE(*t); t++) ;
2215                     if (isIDFIRST(*t)) {
2216                         t = scan_word(t, tmpbuf, TRUE, &len);
2217                         if (*t != '(' && perl_get_cv(tmpbuf, FALSE))
2218                             warn("You need to quote \"%s\"", tmpbuf);
2219                     }
2220                 }
2221             }
2222         }
2223
2224         expect = XOPERATOR;
2225         if (lex_state == LEX_NORMAL && isSPACE(*d)) {
2226             bool islop = (last_lop == oldoldbufptr);
2227             if (!islop || last_lop_op == OP_GREPSTART)
2228                 expect = XOPERATOR;
2229             else if (strchr("$@\"'`q", *s))
2230                 expect = XTERM;         /* e.g. print $fh "foo" */
2231             else if (strchr("&*<%", *s) && isIDFIRST(s[1]))
2232                 expect = XTERM;         /* e.g. print $fh &sub */
2233             else if (isDIGIT(*s))
2234                 expect = XTERM;         /* e.g. print $fh 3 */
2235             else if (*s == '.' && isDIGIT(s[1]))
2236                 expect = XTERM;         /* e.g. print $fh .3 */
2237             else if (strchr("/?-+", *s) && !isSPACE(s[1]))
2238                 expect = XTERM;         /* e.g. print $fh -1 */
2239             else if (*s == '<' && s[1] == '<' && !isSPACE(s[2]))
2240                 expect = XTERM;         /* print $fh <<"EOF" */
2241         }
2242         pending_ident = '$';
2243         TOKEN('$');
2244
2245     case '@':
2246         if (expect == XOPERATOR)
2247             no_op("Array", s);
2248         tokenbuf[0] = '@';
2249         s = scan_ident(s, bufend, tokenbuf+1, FALSE);
2250         if (!tokenbuf[1]) {
2251             if (s == bufend)
2252                 yyerror("Final @ should be \\@ or @name");
2253             PREREF('@');
2254         }
2255         if (lex_state == LEX_NORMAL)
2256             s = skipspace(s);
2257         if ((expect != XREF || oldoldbufptr == last_lop) && intuit_more(s)) {
2258             if (*s == '{')
2259                 tokenbuf[0] = '%';
2260
2261             /* Warn about @ where they meant $. */
2262             if (dowarn) {
2263                 if (*s == '[' || *s == '{') {
2264                     char *t = s + 1;
2265                     while (*t && (isALNUM(*t) || strchr(" \t$#+-'\"", *t)))
2266                         t++;
2267                     if (*t == '}' || *t == ']') {
2268                         t++;
2269                         bufptr = skipspace(bufptr);
2270                         warn("Scalar value %.*s better written as $%.*s",
2271                             t-bufptr, bufptr, t-bufptr-1, bufptr+1);
2272                     }
2273                 }
2274             }
2275         }
2276         pending_ident = '@';
2277         TERM('@');
2278
2279     case '/':                   /* may either be division or pattern */
2280     case '?':                   /* may either be conditional or pattern */
2281         if (expect != XOPERATOR) {
2282             check_uni();
2283             s = scan_pat(s);
2284             TERM(sublex_start());
2285         }
2286         tmp = *s++;
2287         if (tmp == '/')
2288             Mop(OP_DIVIDE);
2289         OPERATOR(tmp);
2290
2291     case '.':
2292         if (lex_formbrack && lex_brackets == lex_formbrack && s[1] == '\n' &&
2293                 (s == linestart || s[-1] == '\n') ) {
2294             lex_formbrack = 0;
2295             expect = XSTATE;
2296             goto rightbracket;
2297         }
2298         if (expect == XOPERATOR || !isDIGIT(s[1])) {
2299             tmp = *s++;
2300             if (*s == tmp) {
2301                 s++;
2302                 if (*s == tmp) {
2303                     s++;
2304                     yylval.ival = OPf_SPECIAL;
2305                 }
2306                 else
2307                     yylval.ival = 0;
2308                 OPERATOR(DOTDOT);
2309             }
2310             if (expect != XOPERATOR)
2311                 check_uni();
2312             Aop(OP_CONCAT);
2313         }
2314         /* FALL THROUGH */
2315     case '0': case '1': case '2': case '3': case '4':
2316     case '5': case '6': case '7': case '8': case '9':
2317         s = scan_num(s);
2318         if (expect == XOPERATOR)
2319             no_op("Number",s);
2320         TERM(THING);
2321
2322     case '\'':
2323         s = scan_str(s);
2324         if (expect == XOPERATOR) {
2325             if (lex_formbrack && lex_brackets == lex_formbrack) {
2326                 expect = XTERM;
2327                 depcom();
2328                 return ',';     /* grandfather non-comma-format format */
2329             }
2330             else
2331                 no_op("String",s);
2332         }
2333         if (!s)
2334             missingterm((char*)0);
2335         yylval.ival = OP_CONST;
2336         TERM(sublex_start());
2337
2338     case '"':
2339         s = scan_str(s);
2340         if (expect == XOPERATOR) {
2341             if (lex_formbrack && lex_brackets == lex_formbrack) {
2342                 expect = XTERM;
2343                 depcom();
2344                 return ',';     /* grandfather non-comma-format format */
2345             }
2346             else
2347                 no_op("String",s);
2348         }
2349         if (!s)
2350             missingterm((char*)0);
2351         yylval.ival = OP_CONST;
2352         for (d = SvPV(lex_stuff, len); len; len--, d++) {
2353             if (*d == '$' || *d == '@' || *d == '\\') {
2354                 yylval.ival = OP_STRINGIFY;
2355                 break;
2356             }
2357         }
2358         TERM(sublex_start());
2359
2360     case '`':
2361         s = scan_str(s);
2362         if (expect == XOPERATOR)
2363             no_op("Backticks",s);
2364         if (!s)
2365             missingterm((char*)0);
2366         yylval.ival = OP_BACKTICK;
2367         set_csh();
2368         TERM(sublex_start());
2369
2370     case '\\':
2371         s++;
2372         if (dowarn && lex_inwhat && isDIGIT(*s))
2373             warn("Can't use \\%c to mean $%c in expression", *s, *s);
2374         if (expect == XOPERATOR)
2375             no_op("Backslash",s);
2376         OPERATOR(REFGEN);
2377
2378     case 'x':
2379         if (isDIGIT(s[1]) && expect == XOPERATOR) {
2380             s++;
2381             Mop(OP_REPEAT);
2382         }
2383         goto keylookup;
2384
2385     case '_':
2386     case 'a': case 'A':
2387     case 'b': case 'B':
2388     case 'c': case 'C':
2389     case 'd': case 'D':
2390     case 'e': case 'E':
2391     case 'f': case 'F':
2392     case 'g': case 'G':
2393     case 'h': case 'H':
2394     case 'i': case 'I':
2395     case 'j': case 'J':
2396     case 'k': case 'K':
2397     case 'l': case 'L':
2398     case 'm': case 'M':
2399     case 'n': case 'N':
2400     case 'o': case 'O':
2401     case 'p': case 'P':
2402     case 'q': case 'Q':
2403     case 'r': case 'R':
2404     case 's': case 'S':
2405     case 't': case 'T':
2406     case 'u': case 'U':
2407     case 'v': case 'V':
2408     case 'w': case 'W':
2409               case 'X':
2410     case 'y': case 'Y':
2411     case 'z': case 'Z':
2412
2413       keylookup:
2414         bufptr = s;
2415         s = scan_word(s, tokenbuf, FALSE, &len);
2416
2417         /* Some keywords can be followed by any delimiter, including ':' */
2418         tmp = (len == 1 && strchr("msyq", tokenbuf[0]) ||
2419                len == 2 && ((tokenbuf[0] == 't' && tokenbuf[1] == 'r') ||
2420                             (tokenbuf[0] == 'q' &&
2421                              strchr("qwx", tokenbuf[1]))));
2422
2423         /* x::* is just a word, unless x is "CORE" */
2424         if (!tmp && *s == ':' && s[1] == ':' && strNE(tokenbuf, "CORE"))
2425             goto just_a_word;
2426
2427         d = s;
2428         while (d < bufend && isSPACE(*d))
2429                 d++;    /* no comments skipped here, or s### is misparsed */
2430
2431         /* Is this a label? */
2432         if (!tmp && expect == XSTATE
2433               && d < bufend && *d == ':' && *(d + 1) != ':') {
2434             s = d + 1;
2435             yylval.pval = savepv(tokenbuf);
2436             CLINE;
2437             TOKEN(LABEL);
2438         }
2439
2440         /* Check for keywords */
2441         tmp = keyword(tokenbuf, len);
2442
2443         /* Is this a word before a => operator? */
2444         if (strnEQ(d,"=>",2)) {
2445             CLINE;
2446             if (dowarn && (tmp || perl_get_cv(tokenbuf, FALSE)))
2447                 warn("Ambiguous use of %s => resolved to \"%s\" =>",
2448                         tokenbuf, tokenbuf);
2449             yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf,0));
2450             yylval.opval->op_private = OPpCONST_BARE;
2451             TERM(WORD);
2452         }
2453
2454         if (tmp < 0) {                  /* second-class keyword? */
2455             GV* gv;
2456             if (expect != XOPERATOR &&
2457                 (*s != ':' || s[1] != ':') &&
2458                 (gv = gv_fetchpv(tokenbuf, FALSE, SVt_PVCV)) &&
2459                 GvIMPORTED_CV(gv))
2460             {
2461                 tmp = 0;
2462             }
2463             else
2464                 tmp = -tmp;
2465         }
2466
2467       reserved_word:
2468         switch (tmp) {
2469
2470         default:                        /* not a keyword */
2471           just_a_word: {
2472                 GV *gv;
2473                 char lastchar = (bufptr == oldoldbufptr ? 0 : bufptr[-1]);
2474
2475                 /* Get the rest if it looks like a package qualifier */
2476
2477                 if (*s == '\'' || *s == ':' && s[1] == ':') {
2478                     s = scan_word(s, tokenbuf + len, TRUE, &len);
2479                     if (!len)
2480                         croak("Bad name after %s::", tokenbuf);
2481                 }
2482
2483                 if (expect == XOPERATOR) {
2484                     if (bufptr == linestart) {
2485                         curcop->cop_line--;
2486                         warn(warn_nosemi);
2487                         curcop->cop_line++;
2488                     }
2489                     else
2490                         no_op("Bare word",s);
2491                 }
2492
2493                 /* Look for a subroutine with this name in current package. */
2494
2495                 gv = gv_fetchpv(tokenbuf,FALSE, SVt_PVCV);
2496
2497                 /* Presume this is going to be a bareword of some sort. */
2498
2499                 CLINE;
2500                 yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf,0));
2501                 yylval.opval->op_private = OPpCONST_BARE;
2502
2503                 /* See if it's the indirect object for a list operator. */
2504
2505                 if (oldoldbufptr &&
2506                     oldoldbufptr < bufptr &&
2507                     (oldoldbufptr == last_lop || oldoldbufptr == last_uni) &&
2508                     /* NO SKIPSPACE BEFORE HERE! */
2509                     (expect == XREF ||
2510                      (opargs[last_lop_op] >> OASHIFT & 7) == OA_FILEREF) )
2511                 {
2512                     bool immediate_paren = *s == '(';
2513
2514                     /* (Now we can afford to cross potential line boundary.) */
2515                     s = skipspace(s);
2516
2517                     /* Two barewords in a row may indicate method call. */
2518
2519                     if ((isALPHA(*s) || *s == '$') && (tmp=intuit_method(s,gv)))
2520                         return tmp;
2521
2522                     /* If not a declared subroutine, it's an indirect object. */
2523                     /* (But it's an indir obj regardless for sort.) */
2524
2525                     if ((last_lop_op == OP_SORT ||
2526                          (!immediate_paren && (!gv || !GvCVu(gv))) ) &&
2527                         (last_lop_op != OP_MAPSTART && last_lop_op != OP_GREPSTART)){
2528                         expect = (last_lop == oldoldbufptr) ? XTERM : XOPERATOR;
2529                         goto bareword;
2530                     }
2531                 }
2532
2533                 /* If followed by a paren, it's certainly a subroutine. */
2534
2535                 expect = XOPERATOR;
2536                 s = skipspace(s);
2537                 if (*s == '(') {
2538                     CLINE;
2539                     nextval[nexttoke].opval = yylval.opval;
2540                     expect = XOPERATOR;
2541                     force_next(WORD);
2542                     yylval.ival = 0;
2543                     TOKEN('&');
2544                 }
2545
2546                 /* If followed by var or block, call it a method (unless sub) */
2547
2548                 if ((*s == '$' || *s == '{') && (!gv || !GvCVu(gv))) {
2549                     last_lop = oldbufptr;
2550                     last_lop_op = OP_METHOD;
2551                     PREBLOCK(METHOD);
2552                 }
2553
2554                 /* If followed by a bareword, see if it looks like indir obj. */
2555
2556                 if ((isALPHA(*s) || *s == '$') && (tmp = intuit_method(s,gv)))
2557                     return tmp;
2558
2559                 /* Not a method, so call it a subroutine (if defined) */
2560
2561                 if (gv && GvCVu(gv)) {
2562                     CV* cv = GvCV(gv);
2563                     if (*s == '(') {
2564                         nextval[nexttoke].opval = yylval.opval;
2565                         expect = XTERM;
2566                         force_next(WORD);
2567                         yylval.ival = 0;
2568                         TOKEN('&');
2569                     }
2570                     if (lastchar == '-')
2571                         warn("Ambiguous use of -%s resolved as -&%s()",
2572                                 tokenbuf, tokenbuf);
2573                     last_lop = oldbufptr;
2574                     last_lop_op = OP_ENTERSUB;
2575                     /* Check for a constant sub */
2576                     {
2577                         SV *sv = cv_const_sv(cv);
2578                         if (sv) {
2579                             SvREFCNT_dec(((SVOP*)yylval.opval)->op_sv);
2580                             ((SVOP*)yylval.opval)->op_sv = SvREFCNT_inc(sv);
2581                             yylval.opval->op_private = 0;
2582                             TOKEN(WORD);
2583                         }
2584                     }
2585
2586                     /* Resolve to GV now. */
2587                     op_free(yylval.opval);
2588                     yylval.opval = newCVREF(0, newGVOP(OP_GV, 0, gv));
2589                     /* Is there a prototype? */
2590                     if (SvPOK(cv)) {
2591                         STRLEN len;
2592                         char *proto = SvPV((SV*)cv, len);
2593                         if (!len)
2594                             TERM(FUNC0SUB);
2595                         if (strEQ(proto, "$"))
2596                             OPERATOR(UNIOPSUB);
2597                         if (*proto == '&' && *s == '{') {
2598                             sv_setpv(subname,"__ANON__");
2599                             PREBLOCK(LSTOPSUB);
2600                         }
2601                     }
2602                     nextval[nexttoke].opval = yylval.opval;
2603                     expect = XTERM;
2604                     force_next(WORD);
2605                     TOKEN(NOAMP);
2606                 }
2607
2608                 if (hints & HINT_STRICT_SUBS &&
2609                     lastchar != '-' &&
2610                     strnNE(s,"->",2) &&
2611                     last_lop_op != OP_TRUNCATE &&  /* S/F prototype in opcode.pl */
2612                     last_lop_op != OP_ACCEPT &&
2613                     last_lop_op != OP_PIPE_OP &&
2614                     last_lop_op != OP_SOCKPAIR)
2615                 {
2616                     warn(
2617                      "Bareword \"%s\" not allowed while \"strict subs\" in use",
2618                         tokenbuf);
2619                     ++error_count;
2620                 }
2621
2622                 /* Call it a bare word */
2623
2624             bareword:
2625                 if (dowarn) {
2626                     if (lastchar != '-') {
2627                         for (d = tokenbuf; *d && isLOWER(*d); d++) ;
2628                         if (!*d)
2629                             warn(warn_reserved, tokenbuf);
2630                     }
2631                 }
2632                 if (lastchar && strchr("*%&", lastchar)) {
2633                     warn("Operator or semicolon missing before %c%s",
2634                         lastchar, tokenbuf);
2635                     warn("Ambiguous use of %c resolved as operator %c",
2636                         lastchar, lastchar);
2637                 }
2638                 TOKEN(WORD);
2639             }
2640
2641         case KEY___LINE__:
2642         case KEY___FILE__: {
2643             if (tokenbuf[2] == 'L')
2644                 (void)sprintf(tokenbuf,"%ld",(long)curcop->cop_line);
2645             else
2646                 strcpy(tokenbuf, SvPVX(GvSV(curcop->cop_filegv)));
2647             yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf,0));
2648             TERM(THING);
2649         }
2650
2651         case KEY___DATA__:
2652         case KEY___END__: {
2653             GV *gv;
2654
2655             /*SUPPRESS 560*/
2656             if (rsfp && (!in_eval || tokenbuf[2] == 'D')) {
2657                 char dname[256];
2658                 char *pname = "main";
2659                 if (tokenbuf[2] == 'D')
2660                     pname = HvNAME(curstash ? curstash : defstash);
2661                 sprintf(dname,"%s::DATA", pname);
2662                 gv = gv_fetchpv(dname,TRUE, SVt_PVIO);
2663                 GvMULTI_on(gv);
2664                 if (!GvIO(gv))
2665                     GvIOp(gv) = newIO();
2666                 IoIFP(GvIOp(gv)) = rsfp;
2667 #if defined(HAS_FCNTL) && defined(F_SETFD)
2668                 {
2669                     int fd = PerlIO_fileno(rsfp);
2670                     fcntl(fd,F_SETFD,fd >= 3);
2671                 }
2672 #endif
2673                 /* Mark this internal pseudo-handle as clean */
2674                 IoFLAGS(GvIOp(gv)) |= IOf_UNTAINT;
2675                 if (preprocess)
2676                     IoTYPE(GvIOp(gv)) = '|';
2677                 else if ((PerlIO*)rsfp == PerlIO_stdin())
2678                     IoTYPE(GvIOp(gv)) = '-';
2679                 else
2680                     IoTYPE(GvIOp(gv)) = '<';
2681                 rsfp = Nullfp;
2682             }
2683             goto fake_eof;
2684         }
2685
2686         case KEY_AUTOLOAD:
2687         case KEY_DESTROY:
2688         case KEY_BEGIN:
2689         case KEY_END:
2690             if (expect == XSTATE) {
2691                 s = bufptr;
2692                 goto really_sub;
2693             }
2694             goto just_a_word;
2695
2696         case KEY_CORE:
2697             if (*s == ':' && s[1] == ':') {
2698                 s += 2;
2699                 d = s;
2700                 s = scan_word(s, tokenbuf, FALSE, &len);
2701                 tmp = keyword(tokenbuf, len);
2702                 if (tmp < 0)
2703                     tmp = -tmp;
2704                 goto reserved_word;
2705             }
2706             goto just_a_word;
2707
2708         case KEY_abs:
2709             UNI(OP_ABS);
2710
2711         case KEY_alarm:
2712             UNI(OP_ALARM);
2713
2714         case KEY_accept:
2715             LOP(OP_ACCEPT,XTERM);
2716
2717         case KEY_and:
2718             OPERATOR(ANDOP);
2719
2720         case KEY_atan2:
2721             LOP(OP_ATAN2,XTERM);
2722
2723         case KEY_bind:
2724             LOP(OP_BIND,XTERM);
2725
2726         case KEY_binmode:
2727             UNI(OP_BINMODE);
2728
2729         case KEY_bless:
2730             LOP(OP_BLESS,XTERM);
2731
2732         case KEY_chop:
2733             UNI(OP_CHOP);
2734
2735         case KEY_continue:
2736             PREBLOCK(CONTINUE);
2737
2738         case KEY_chdir:
2739             (void)gv_fetchpv("ENV",TRUE, SVt_PVHV);     /* may use HOME */
2740             UNI(OP_CHDIR);
2741
2742         case KEY_close:
2743             UNI(OP_CLOSE);
2744
2745         case KEY_closedir:
2746             UNI(OP_CLOSEDIR);
2747
2748         case KEY_cmp:
2749             Eop(OP_SCMP);
2750
2751         case KEY_caller:
2752             UNI(OP_CALLER);
2753
2754         case KEY_crypt:
2755 #ifdef FCRYPT
2756             if (!cryptseen++)
2757                 init_des();
2758 #endif
2759             LOP(OP_CRYPT,XTERM);
2760
2761         case KEY_chmod:
2762             if (dowarn) {
2763                 for (d = s; d < bufend && (isSPACE(*d) || *d == '('); d++) ;
2764                 if (*d != '0' && isDIGIT(*d))
2765                     yywarn("chmod: mode argument is missing initial 0");
2766             }
2767             LOP(OP_CHMOD,XTERM);
2768
2769         case KEY_chown:
2770             LOP(OP_CHOWN,XTERM);
2771
2772         case KEY_connect:
2773             LOP(OP_CONNECT,XTERM);
2774
2775         case KEY_chr:
2776             UNI(OP_CHR);
2777
2778         case KEY_cos:
2779             UNI(OP_COS);
2780
2781         case KEY_chroot:
2782             UNI(OP_CHROOT);
2783
2784         case KEY_do:
2785             s = skipspace(s);
2786             if (*s == '{')
2787                 PRETERMBLOCK(DO);
2788             if (*s != '\'')
2789                 s = force_word(s,WORD,FALSE,TRUE,FALSE);
2790             OPERATOR(DO);
2791
2792         case KEY_die:
2793             hints |= HINT_BLOCK_SCOPE;
2794             LOP(OP_DIE,XTERM);
2795
2796         case KEY_defined:
2797             UNI(OP_DEFINED);
2798
2799         case KEY_delete:
2800             UNI(OP_DELETE);
2801
2802         case KEY_dbmopen:
2803             gv_fetchpv("AnyDBM_File::ISA", GV_ADDMULTI, SVt_PVAV);
2804             LOP(OP_DBMOPEN,XTERM);
2805
2806         case KEY_dbmclose:
2807             UNI(OP_DBMCLOSE);
2808
2809         case KEY_dump:
2810             s = force_word(s,WORD,TRUE,FALSE,FALSE);
2811             LOOPX(OP_DUMP);
2812
2813         case KEY_else:
2814             PREBLOCK(ELSE);
2815
2816         case KEY_elsif:
2817             yylval.ival = curcop->cop_line;
2818             OPERATOR(ELSIF);
2819
2820         case KEY_eq:
2821             Eop(OP_SEQ);
2822
2823         case KEY_exists:
2824             UNI(OP_EXISTS);
2825             
2826         case KEY_exit:
2827             UNI(OP_EXIT);
2828
2829         case KEY_eval:
2830             s = skipspace(s);
2831             expect = (*s == '{') ? XTERMBLOCK : XTERM;
2832             UNIBRACK(OP_ENTEREVAL);
2833
2834         case KEY_eof:
2835             UNI(OP_EOF);
2836
2837         case KEY_exp:
2838             UNI(OP_EXP);
2839
2840         case KEY_each:
2841             UNI(OP_EACH);
2842
2843         case KEY_exec:
2844             set_csh();
2845             LOP(OP_EXEC,XREF);
2846
2847         case KEY_endhostent:
2848             FUN0(OP_EHOSTENT);
2849
2850         case KEY_endnetent:
2851             FUN0(OP_ENETENT);
2852
2853         case KEY_endservent:
2854             FUN0(OP_ESERVENT);
2855
2856         case KEY_endprotoent:
2857             FUN0(OP_EPROTOENT);
2858
2859         case KEY_endpwent:
2860             FUN0(OP_EPWENT);
2861
2862         case KEY_endgrent:
2863             FUN0(OP_EGRENT);
2864
2865         case KEY_for:
2866         case KEY_foreach:
2867             yylval.ival = curcop->cop_line;
2868             s = skipspace(s);
2869             if (isIDFIRST(*s)) {
2870                 char *p = s;
2871                 if ((bufend - p) >= 3 &&
2872                     strnEQ(p, "my", 2) && isSPACE(*(p + 2)))
2873                     p += 2;
2874                 p = skipspace(p);
2875                 if (isIDFIRST(*p))
2876                     croak("Missing $ on loop variable");
2877             }
2878             OPERATOR(FOR);
2879
2880         case KEY_formline:
2881             LOP(OP_FORMLINE,XTERM);
2882
2883         case KEY_fork:
2884             FUN0(OP_FORK);
2885
2886         case KEY_fcntl:
2887             LOP(OP_FCNTL,XTERM);
2888
2889         case KEY_fileno:
2890             UNI(OP_FILENO);
2891
2892         case KEY_flock:
2893             LOP(OP_FLOCK,XTERM);
2894
2895         case KEY_gt:
2896             Rop(OP_SGT);
2897
2898         case KEY_ge:
2899             Rop(OP_SGE);
2900
2901         case KEY_grep:
2902             LOP(OP_GREPSTART, *s == '(' ? XTERM : XREF);
2903
2904         case KEY_goto:
2905             s = force_word(s,WORD,TRUE,FALSE,FALSE);
2906             LOOPX(OP_GOTO);
2907
2908         case KEY_gmtime:
2909             UNI(OP_GMTIME);
2910
2911         case KEY_getc:
2912             UNI(OP_GETC);
2913
2914         case KEY_getppid:
2915             FUN0(OP_GETPPID);
2916
2917         case KEY_getpgrp:
2918             UNI(OP_GETPGRP);
2919
2920         case KEY_getpriority:
2921             LOP(OP_GETPRIORITY,XTERM);
2922
2923         case KEY_getprotobyname:
2924             UNI(OP_GPBYNAME);
2925
2926         case KEY_getprotobynumber:
2927             LOP(OP_GPBYNUMBER,XTERM);
2928
2929         case KEY_getprotoent:
2930             FUN0(OP_GPROTOENT);
2931
2932         case KEY_getpwent:
2933             FUN0(OP_GPWENT);
2934
2935         case KEY_getpwnam:
2936             UNI(OP_GPWNAM);
2937
2938         case KEY_getpwuid:
2939             UNI(OP_GPWUID);
2940
2941         case KEY_getpeername:
2942             UNI(OP_GETPEERNAME);
2943
2944         case KEY_gethostbyname:
2945             UNI(OP_GHBYNAME);
2946
2947         case KEY_gethostbyaddr:
2948             LOP(OP_GHBYADDR,XTERM);
2949
2950         case KEY_gethostent:
2951             FUN0(OP_GHOSTENT);
2952
2953         case KEY_getnetbyname:
2954             UNI(OP_GNBYNAME);
2955
2956         case KEY_getnetbyaddr:
2957             LOP(OP_GNBYADDR,XTERM);
2958
2959         case KEY_getnetent:
2960             FUN0(OP_GNETENT);
2961
2962         case KEY_getservbyname:
2963             LOP(OP_GSBYNAME,XTERM);
2964
2965         case KEY_getservbyport:
2966             LOP(OP_GSBYPORT,XTERM);
2967
2968         case KEY_getservent:
2969             FUN0(OP_GSERVENT);
2970
2971         case KEY_getsockname:
2972             UNI(OP_GETSOCKNAME);
2973
2974         case KEY_getsockopt:
2975             LOP(OP_GSOCKOPT,XTERM);
2976
2977         case KEY_getgrent:
2978             FUN0(OP_GGRENT);
2979
2980         case KEY_getgrnam:
2981             UNI(OP_GGRNAM);
2982
2983         case KEY_getgrgid:
2984             UNI(OP_GGRGID);
2985
2986         case KEY_getlogin:
2987             FUN0(OP_GETLOGIN);
2988
2989         case KEY_glob:
2990             set_csh();
2991             LOP(OP_GLOB,XTERM);
2992
2993         case KEY_hex:
2994             UNI(OP_HEX);
2995
2996         case KEY_if:
2997             yylval.ival = curcop->cop_line;
2998             OPERATOR(IF);
2999
3000         case KEY_index:
3001             LOP(OP_INDEX,XTERM);
3002
3003         case KEY_int:
3004             UNI(OP_INT);
3005
3006         case KEY_ioctl:
3007             LOP(OP_IOCTL,XTERM);
3008
3009         case KEY_join:
3010             LOP(OP_JOIN,XTERM);
3011
3012         case KEY_keys:
3013             UNI(OP_KEYS);
3014
3015         case KEY_kill:
3016             LOP(OP_KILL,XTERM);
3017
3018         case KEY_last:
3019             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3020             LOOPX(OP_LAST);
3021             
3022         case KEY_lc:
3023             UNI(OP_LC);
3024
3025         case KEY_lcfirst:
3026             UNI(OP_LCFIRST);
3027
3028         case KEY_local:
3029             OPERATOR(LOCAL);
3030
3031         case KEY_length:
3032             UNI(OP_LENGTH);
3033
3034         case KEY_lt:
3035             Rop(OP_SLT);
3036
3037         case KEY_le:
3038             Rop(OP_SLE);
3039
3040         case KEY_localtime:
3041             UNI(OP_LOCALTIME);
3042
3043         case KEY_log:
3044             UNI(OP_LOG);
3045
3046         case KEY_link:
3047             LOP(OP_LINK,XTERM);
3048
3049         case KEY_listen:
3050             LOP(OP_LISTEN,XTERM);
3051
3052         case KEY_lstat:
3053             UNI(OP_LSTAT);
3054
3055         case KEY_m:
3056             s = scan_pat(s);
3057             TERM(sublex_start());
3058
3059         case KEY_map:
3060             LOP(OP_MAPSTART,XREF);
3061             
3062         case KEY_mkdir:
3063             LOP(OP_MKDIR,XTERM);
3064
3065         case KEY_msgctl:
3066             LOP(OP_MSGCTL,XTERM);
3067
3068         case KEY_msgget:
3069             LOP(OP_MSGGET,XTERM);
3070
3071         case KEY_msgrcv:
3072             LOP(OP_MSGRCV,XTERM);
3073
3074         case KEY_msgsnd:
3075             LOP(OP_MSGSND,XTERM);
3076
3077         case KEY_my:
3078             in_my = TRUE;
3079             OPERATOR(MY);
3080
3081         case KEY_next:
3082             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3083             LOOPX(OP_NEXT);
3084
3085         case KEY_ne:
3086             Eop(OP_SNE);
3087
3088         case KEY_no:
3089             if (expect != XSTATE)
3090                 yyerror("\"no\" not allowed in expression");
3091             s = force_word(s,WORD,FALSE,TRUE,FALSE);
3092             s = force_version(s);
3093             yylval.ival = 0;
3094             OPERATOR(USE);
3095
3096         case KEY_not:
3097             OPERATOR(NOTOP);
3098
3099         case KEY_open:
3100             s = skipspace(s);
3101             if (isIDFIRST(*s)) {
3102                 char *t;
3103                 for (d = s; isALNUM(*d); d++) ;
3104                 t = skipspace(d);
3105                 if (strchr("|&*+-=!?:.", *t))
3106                     warn("Precedence problem: open %.*s should be open(%.*s)",
3107                         d-s,s, d-s,s);
3108             }
3109             LOP(OP_OPEN,XTERM);
3110
3111         case KEY_or:
3112             yylval.ival = OP_OR;
3113             OPERATOR(OROP);
3114
3115         case KEY_ord:
3116             UNI(OP_ORD);
3117
3118         case KEY_oct:
3119             UNI(OP_OCT);
3120
3121         case KEY_opendir:
3122             LOP(OP_OPEN_DIR,XTERM);
3123
3124         case KEY_print:
3125             checkcomma(s,tokenbuf,"filehandle");
3126             LOP(OP_PRINT,XREF);
3127
3128         case KEY_printf:
3129             checkcomma(s,tokenbuf,"filehandle");
3130             LOP(OP_PRTF,XREF);
3131
3132         case KEY_prototype:
3133             UNI(OP_PROTOTYPE);
3134
3135         case KEY_push:
3136             LOP(OP_PUSH,XTERM);
3137
3138         case KEY_pop:
3139             UNI(OP_POP);
3140
3141         case KEY_pos:
3142             UNI(OP_POS);
3143             
3144         case KEY_pack:
3145             LOP(OP_PACK,XTERM);
3146
3147         case KEY_package:
3148             s = force_word(s,WORD,FALSE,TRUE,FALSE);
3149             OPERATOR(PACKAGE);
3150
3151         case KEY_pipe:
3152             LOP(OP_PIPE_OP,XTERM);
3153
3154         case KEY_q:
3155             s = scan_str(s);
3156             if (!s)
3157                 missingterm((char*)0);
3158             yylval.ival = OP_CONST;
3159             TERM(sublex_start());
3160
3161         case KEY_quotemeta:
3162             UNI(OP_QUOTEMETA);
3163
3164         case KEY_qw:
3165             s = scan_str(s);
3166             if (!s)
3167                 missingterm((char*)0);
3168             if (dowarn && SvLEN(lex_stuff)) {
3169                 d = SvPV_force(lex_stuff, len);
3170                 for (; len; --len, ++d) {
3171                     if (*d == ',') {
3172                         warn("Possible attempt to separate words with commas");
3173                         break;
3174                     }
3175                     if (*d == '#') {
3176                         warn("Possible attempt to put comments in qw() list");
3177                         break;
3178                     }
3179                 }
3180             }
3181             force_next(')');
3182             nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, q(lex_stuff));
3183             lex_stuff = Nullsv;
3184             force_next(THING);
3185             force_next(',');
3186             nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(" ",1));
3187             force_next(THING);
3188             force_next('(');
3189             yylval.ival = OP_SPLIT;
3190             CLINE;
3191             expect = XTERM;
3192             bufptr = s;
3193             last_lop = oldbufptr;
3194             last_lop_op = OP_SPLIT;
3195             return FUNC;
3196
3197         case KEY_qq:
3198             s = scan_str(s);
3199             if (!s)
3200                 missingterm((char*)0);
3201             yylval.ival = OP_STRINGIFY;
3202             if (SvIVX(lex_stuff) == '\'')
3203                 SvIVX(lex_stuff) = 0;   /* qq'$foo' should intepolate */
3204             TERM(sublex_start());
3205
3206         case KEY_qx:
3207             s = scan_str(s);
3208             if (!s)
3209                 missingterm((char*)0);
3210             yylval.ival = OP_BACKTICK;
3211             set_csh();
3212             TERM(sublex_start());
3213
3214         case KEY_return:
3215             OLDLOP(OP_RETURN);
3216
3217         case KEY_require:
3218             *tokenbuf = '\0';
3219             s = force_word(s,WORD,TRUE,TRUE,FALSE);
3220             if (isIDFIRST(*tokenbuf))
3221                 gv_stashpvn(tokenbuf, strlen(tokenbuf), TRUE);
3222             else if (*s == '<')
3223                 yyerror("<> should be quotes");
3224             UNI(OP_REQUIRE);
3225
3226         case KEY_reset:
3227             UNI(OP_RESET);
3228
3229         case KEY_redo:
3230             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3231             LOOPX(OP_REDO);
3232
3233         case KEY_rename:
3234             LOP(OP_RENAME,XTERM);
3235
3236         case KEY_rand:
3237             UNI(OP_RAND);
3238
3239         case KEY_rmdir:
3240             UNI(OP_RMDIR);
3241
3242         case KEY_rindex:
3243             LOP(OP_RINDEX,XTERM);
3244
3245         case KEY_read:
3246             LOP(OP_READ,XTERM);
3247
3248         case KEY_readdir:
3249             UNI(OP_READDIR);
3250
3251         case KEY_readline:
3252             set_csh();
3253             UNI(OP_READLINE);
3254
3255         case KEY_readpipe:
3256             set_csh();
3257             UNI(OP_BACKTICK);
3258
3259         case KEY_rewinddir:
3260             UNI(OP_REWINDDIR);
3261
3262         case KEY_recv:
3263             LOP(OP_RECV,XTERM);
3264
3265         case KEY_reverse:
3266             LOP(OP_REVERSE,XTERM);
3267
3268         case KEY_readlink:
3269             UNI(OP_READLINK);
3270
3271         case KEY_ref:
3272             UNI(OP_REF);
3273
3274         case KEY_s:
3275             s = scan_subst(s);
3276             if (yylval.opval)
3277                 TERM(sublex_start());
3278             else
3279                 TOKEN(1);       /* force error */
3280
3281         case KEY_chomp:
3282             UNI(OP_CHOMP);
3283             
3284         case KEY_scalar:
3285             UNI(OP_SCALAR);
3286
3287         case KEY_select:
3288             LOP(OP_SELECT,XTERM);
3289
3290         case KEY_seek:
3291             LOP(OP_SEEK,XTERM);
3292
3293         case KEY_semctl:
3294             LOP(OP_SEMCTL,XTERM);
3295
3296         case KEY_semget:
3297             LOP(OP_SEMGET,XTERM);
3298
3299         case KEY_semop:
3300             LOP(OP_SEMOP,XTERM);
3301
3302         case KEY_send:
3303             LOP(OP_SEND,XTERM);
3304
3305         case KEY_setpgrp:
3306             LOP(OP_SETPGRP,XTERM);
3307
3308         case KEY_setpriority:
3309             LOP(OP_SETPRIORITY,XTERM);
3310
3311         case KEY_sethostent:
3312             UNI(OP_SHOSTENT);
3313
3314         case KEY_setnetent:
3315             UNI(OP_SNETENT);
3316
3317         case KEY_setservent:
3318             UNI(OP_SSERVENT);
3319
3320         case KEY_setprotoent:
3321             UNI(OP_SPROTOENT);
3322
3323         case KEY_setpwent:
3324             FUN0(OP_SPWENT);
3325
3326         case KEY_setgrent:
3327             FUN0(OP_SGRENT);
3328
3329         case KEY_seekdir:
3330             LOP(OP_SEEKDIR,XTERM);
3331
3332         case KEY_setsockopt:
3333             LOP(OP_SSOCKOPT,XTERM);
3334
3335         case KEY_shift:
3336             UNI(OP_SHIFT);
3337
3338         case KEY_shmctl:
3339             LOP(OP_SHMCTL,XTERM);
3340
3341         case KEY_shmget:
3342             LOP(OP_SHMGET,XTERM);
3343
3344         case KEY_shmread:
3345             LOP(OP_SHMREAD,XTERM);
3346
3347         case KEY_shmwrite:
3348             LOP(OP_SHMWRITE,XTERM);
3349
3350         case KEY_shutdown:
3351             LOP(OP_SHUTDOWN,XTERM);
3352
3353         case KEY_sin:
3354             UNI(OP_SIN);
3355
3356         case KEY_sleep:
3357             UNI(OP_SLEEP);
3358
3359         case KEY_socket:
3360             LOP(OP_SOCKET,XTERM);
3361
3362         case KEY_socketpair:
3363             LOP(OP_SOCKPAIR,XTERM);
3364
3365         case KEY_sort:
3366             checkcomma(s,tokenbuf,"subroutine name");
3367             s = skipspace(s);
3368             if (*s == ';' || *s == ')')         /* probably a close */
3369                 croak("sort is now a reserved word");
3370             expect = XTERM;
3371             s = force_word(s,WORD,TRUE,TRUE,TRUE);
3372             LOP(OP_SORT,XREF);
3373
3374         case KEY_split:
3375             LOP(OP_SPLIT,XTERM);
3376
3377         case KEY_sprintf:
3378             LOP(OP_SPRINTF,XTERM);
3379
3380         case KEY_splice:
3381             LOP(OP_SPLICE,XTERM);
3382
3383         case KEY_sqrt:
3384             UNI(OP_SQRT);
3385
3386         case KEY_srand:
3387             UNI(OP_SRAND);
3388
3389         case KEY_stat:
3390             UNI(OP_STAT);
3391
3392         case KEY_study:
3393             sawstudy++;
3394             UNI(OP_STUDY);
3395
3396         case KEY_substr:
3397             LOP(OP_SUBSTR,XTERM);
3398
3399         case KEY_format:
3400         case KEY_sub:
3401           really_sub:
3402             s = skipspace(s);
3403
3404             if (isIDFIRST(*s) || *s == '\'' || *s == ':') {
3405                 char tmpbuf[128];
3406                 expect = XBLOCK;
3407                 d = scan_word(s, tmpbuf, TRUE, &len);
3408                 if (strchr(tmpbuf, ':'))
3409                     sv_setpv(subname, tmpbuf);
3410                 else {
3411                     sv_setsv(subname,curstname);
3412                     sv_catpvn(subname,"::",2);
3413                     sv_catpvn(subname,tmpbuf,len);
3414                 }
3415                 s = force_word(s,WORD,FALSE,TRUE,TRUE);
3416                 s = skipspace(s);
3417             }
3418             else {
3419                 expect = XTERMBLOCK;
3420                 sv_setpv(subname,"?");
3421             }
3422
3423             if (tmp == KEY_format) {
3424                 s = skipspace(s);
3425                 if (*s == '=')
3426                     lex_formbrack = lex_brackets + 1;
3427                 OPERATOR(FORMAT);
3428             }
3429
3430             /* Look for a prototype */
3431             if (*s == '(') {
3432                 s = scan_str(s);
3433                 if (!s) {
3434                     if (lex_stuff)
3435                         SvREFCNT_dec(lex_stuff);
3436                     lex_stuff = Nullsv;
3437                     croak("Prototype not terminated");
3438                 }
3439                 nexttoke++;
3440                 nextval[1] = nextval[0];
3441                 nexttype[1] = nexttype[0];
3442                 nextval[0].opval = (OP*)newSVOP(OP_CONST, 0, lex_stuff);
3443                 nexttype[0] = THING;
3444                 if (nexttoke == 1) {
3445                     lex_defer = lex_state;
3446                     lex_expect = expect;
3447                     lex_state = LEX_KNOWNEXT;
3448                 }
3449                 lex_stuff = Nullsv;
3450             }
3451
3452             if (*SvPV(subname,na) == '?') {
3453                 sv_setpv(subname,"__ANON__");
3454                 TOKEN(ANONSUB);
3455             }
3456             PREBLOCK(SUB);
3457
3458         case KEY_system:
3459             set_csh();
3460             LOP(OP_SYSTEM,XREF);
3461
3462         case KEY_symlink:
3463             LOP(OP_SYMLINK,XTERM);
3464
3465         case KEY_syscall:
3466             LOP(OP_SYSCALL,XTERM);
3467
3468         case KEY_sysopen:
3469             LOP(OP_SYSOPEN,XTERM);
3470
3471         case KEY_sysread:
3472             LOP(OP_SYSREAD,XTERM);
3473
3474         case KEY_syswrite:
3475             LOP(OP_SYSWRITE,XTERM);
3476
3477         case KEY_tr:
3478             s = scan_trans(s);
3479             TERM(sublex_start());
3480
3481         case KEY_tell:
3482             UNI(OP_TELL);
3483
3484         case KEY_telldir:
3485             UNI(OP_TELLDIR);
3486
3487         case KEY_tie:
3488             LOP(OP_TIE,XTERM);
3489
3490         case KEY_tied:
3491             UNI(OP_TIED);
3492
3493         case KEY_time:
3494             FUN0(OP_TIME);
3495
3496         case KEY_times:
3497             FUN0(OP_TMS);
3498
3499         case KEY_truncate:
3500             LOP(OP_TRUNCATE,XTERM);
3501
3502         case KEY_uc:
3503             UNI(OP_UC);
3504
3505         case KEY_ucfirst:
3506             UNI(OP_UCFIRST);
3507
3508         case KEY_untie:
3509             UNI(OP_UNTIE);
3510
3511         case KEY_until:
3512             yylval.ival = curcop->cop_line;
3513             OPERATOR(UNTIL);
3514
3515         case KEY_unless:
3516             yylval.ival = curcop->cop_line;
3517             OPERATOR(UNLESS);
3518
3519         case KEY_unlink:
3520             LOP(OP_UNLINK,XTERM);
3521
3522         case KEY_undef:
3523             UNI(OP_UNDEF);
3524
3525         case KEY_unpack:
3526             LOP(OP_UNPACK,XTERM);
3527
3528         case KEY_utime:
3529             LOP(OP_UTIME,XTERM);
3530
3531         case KEY_umask:
3532             if (dowarn) {
3533                 for (d = s; d < bufend && (isSPACE(*d) || *d == '('); d++) ;
3534                 if (*d != '0' && isDIGIT(*d))
3535                     yywarn("umask: argument is missing initial 0");
3536             }
3537             UNI(OP_UMASK);
3538
3539         case KEY_unshift:
3540             LOP(OP_UNSHIFT,XTERM);
3541
3542         case KEY_use:
3543             if (expect != XSTATE)
3544                 yyerror("\"use\" not allowed in expression");
3545             s = skipspace(s);
3546             if(isDIGIT(*s)) {
3547                 s = force_version(s);
3548                 if(*s == ';' || (s = skipspace(s), *s == ';')) {
3549                     nextval[nexttoke].opval = Nullop;
3550                     force_next(WORD);
3551                 }
3552             }
3553             else {
3554                 s = force_word(s,WORD,FALSE,TRUE,FALSE);
3555                 s = force_version(s);
3556             }
3557             yylval.ival = 1;
3558             OPERATOR(USE);
3559
3560         case KEY_values:
3561             UNI(OP_VALUES);
3562
3563         case KEY_vec:
3564             sawvec = TRUE;
3565             LOP(OP_VEC,XTERM);
3566
3567         case KEY_while:
3568             yylval.ival = curcop->cop_line;
3569             OPERATOR(WHILE);
3570
3571         case KEY_warn:
3572             hints |= HINT_BLOCK_SCOPE;
3573             LOP(OP_WARN,XTERM);
3574
3575         case KEY_wait:
3576             FUN0(OP_WAIT);
3577
3578         case KEY_waitpid:
3579             LOP(OP_WAITPID,XTERM);
3580
3581         case KEY_wantarray:
3582             FUN0(OP_WANTARRAY);
3583
3584         case KEY_write:
3585             gv_fetchpv("\f",TRUE, SVt_PV);      /* Make sure $^L is defined */
3586             UNI(OP_ENTERWRITE);
3587
3588         case KEY_x:
3589             if (expect == XOPERATOR)
3590                 Mop(OP_REPEAT);
3591             check_uni();
3592             goto just_a_word;
3593
3594         case KEY_xor:
3595             yylval.ival = OP_XOR;
3596             OPERATOR(OROP);
3597
3598         case KEY_y:
3599             s = scan_trans(s);
3600             TERM(sublex_start());
3601         }
3602     }
3603 }
3604
3605 I32
3606 keyword(d, len)
3607 register char *d;
3608 I32 len;
3609 {
3610     switch (*d) {
3611     case '_':
3612         if (d[1] == '_') {
3613             if (strEQ(d,"__LINE__"))            return -KEY___LINE__;
3614             if (strEQ(d,"__FILE__"))            return -KEY___FILE__;
3615             if (strEQ(d,"__DATA__"))            return KEY___DATA__;
3616             if (strEQ(d,"__END__"))             return KEY___END__;
3617         }
3618         break;
3619     case 'A':
3620         if (strEQ(d,"AUTOLOAD"))                return KEY_AUTOLOAD;
3621         break;
3622     case 'a':
3623         switch (len) {
3624         case 3:
3625             if (strEQ(d,"and"))                 return -KEY_and;
3626             if (strEQ(d,"abs"))                 return -KEY_abs;
3627             break;
3628         case 5:
3629             if (strEQ(d,"alarm"))               return -KEY_alarm;
3630             if (strEQ(d,"atan2"))               return -KEY_atan2;
3631             break;
3632         case 6:
3633             if (strEQ(d,"accept"))              return -KEY_accept;
3634             break;
3635         }
3636         break;
3637     case 'B':
3638         if (strEQ(d,"BEGIN"))                   return KEY_BEGIN;
3639         break;
3640     case 'b':
3641         if (strEQ(d,"bless"))                   return -KEY_bless;
3642         if (strEQ(d,"bind"))                    return -KEY_bind;
3643         if (strEQ(d,"binmode"))                 return -KEY_binmode;
3644         break;
3645     case 'C':
3646         if (strEQ(d,"CORE"))                    return -KEY_CORE;
3647         break;
3648     case 'c':
3649         switch (len) {
3650         case 3:
3651             if (strEQ(d,"cmp"))                 return -KEY_cmp;
3652             if (strEQ(d,"chr"))                 return -KEY_chr;
3653             if (strEQ(d,"cos"))                 return -KEY_cos;
3654             break;
3655         case 4:
3656             if (strEQ(d,"chop"))                return KEY_chop;
3657             break;
3658         case 5:
3659             if (strEQ(d,"close"))               return -KEY_close;
3660             if (strEQ(d,"chdir"))               return -KEY_chdir;
3661             if (strEQ(d,"chomp"))               return KEY_chomp;
3662             if (strEQ(d,"chmod"))               return -KEY_chmod;
3663             if (strEQ(d,"chown"))               return -KEY_chown;
3664             if (strEQ(d,"crypt"))               return -KEY_crypt;
3665             break;
3666         case 6:
3667             if (strEQ(d,"chroot"))              return -KEY_chroot;
3668             if (strEQ(d,"caller"))              return -KEY_caller;
3669             break;
3670         case 7:
3671             if (strEQ(d,"connect"))             return -KEY_connect;
3672             break;
3673         case 8:
3674             if (strEQ(d,"closedir"))            return -KEY_closedir;
3675             if (strEQ(d,"continue"))            return -KEY_continue;
3676             break;
3677         }
3678         break;
3679     case 'D':
3680         if (strEQ(d,"DESTROY"))                 return KEY_DESTROY;
3681         break;
3682     case 'd':
3683         switch (len) {
3684         case 2:
3685             if (strEQ(d,"do"))                  return KEY_do;
3686             break;
3687         case 3:
3688             if (strEQ(d,"die"))                 return -KEY_die;
3689             break;
3690         case 4:
3691             if (strEQ(d,"dump"))                return -KEY_dump;
3692             break;
3693         case 6:
3694             if (strEQ(d,"delete"))              return KEY_delete;
3695             break;
3696         case 7:
3697             if (strEQ(d,"defined"))             return KEY_defined;
3698             if (strEQ(d,"dbmopen"))             return -KEY_dbmopen;
3699             break;
3700         case 8:
3701             if (strEQ(d,"dbmclose"))            return -KEY_dbmclose;
3702             break;
3703         }
3704         break;
3705     case 'E':
3706         if (strEQ(d,"EQ")) { deprecate(d);      return -KEY_eq;}
3707         if (strEQ(d,"END"))                     return KEY_END;
3708         break;
3709     case 'e':
3710         switch (len) {
3711         case 2:
3712             if (strEQ(d,"eq"))                  return -KEY_eq;
3713             break;
3714         case 3:
3715             if (strEQ(d,"eof"))                 return -KEY_eof;
3716             if (strEQ(d,"exp"))                 return -KEY_exp;
3717             break;
3718         case 4:
3719             if (strEQ(d,"else"))                return KEY_else;
3720             if (strEQ(d,"exit"))                return -KEY_exit;
3721             if (strEQ(d,"eval"))                return KEY_eval;
3722             if (strEQ(d,"exec"))                return -KEY_exec;
3723             if (strEQ(d,"each"))                return KEY_each;
3724             break;
3725         case 5:
3726             if (strEQ(d,"elsif"))               return KEY_elsif;
3727             break;
3728         case 6:
3729             if (strEQ(d,"exists"))              return KEY_exists;
3730             if (strEQ(d,"elseif")) warn("elseif should be elsif");
3731             break;
3732         case 8:
3733             if (strEQ(d,"endgrent"))            return -KEY_endgrent;
3734             if (strEQ(d,"endpwent"))            return -KEY_endpwent;
3735             break;
3736         case 9:
3737             if (strEQ(d,"endnetent"))           return -KEY_endnetent;
3738             break;
3739         case 10:
3740             if (strEQ(d,"endhostent"))          return -KEY_endhostent;
3741             if (strEQ(d,"endservent"))          return -KEY_endservent;
3742             break;
3743         case 11:
3744             if (strEQ(d,"endprotoent"))         return -KEY_endprotoent;
3745             break;
3746         }
3747         break;
3748     case 'f':
3749         switch (len) {
3750         case 3:
3751             if (strEQ(d,"for"))                 return KEY_for;
3752             break;
3753         case 4:
3754             if (strEQ(d,"fork"))                return -KEY_fork;
3755             break;
3756         case 5:
3757             if (strEQ(d,"fcntl"))               return -KEY_fcntl;
3758             if (strEQ(d,"flock"))               return -KEY_flock;
3759             break;
3760         case 6:
3761             if (strEQ(d,"format"))              return KEY_format;
3762             if (strEQ(d,"fileno"))              return -KEY_fileno;
3763             break;
3764         case 7:
3765             if (strEQ(d,"foreach"))             return KEY_foreach;
3766             break;
3767         case 8:
3768             if (strEQ(d,"formline"))            return -KEY_formline;
3769             break;
3770         }
3771         break;
3772     case 'G':
3773         if (len == 2) {
3774             if (strEQ(d,"GT")) { deprecate(d);  return -KEY_gt;}
3775             if (strEQ(d,"GE")) { deprecate(d);  return -KEY_ge;}
3776         }
3777         break;
3778     case 'g':
3779         if (strnEQ(d,"get",3)) {
3780             d += 3;
3781             if (*d == 'p') {
3782                 switch (len) {
3783                 case 7:
3784                     if (strEQ(d,"ppid"))        return -KEY_getppid;
3785                     if (strEQ(d,"pgrp"))        return -KEY_getpgrp;
3786                     break;
3787                 case 8:
3788                     if (strEQ(d,"pwent"))       return -KEY_getpwent;
3789                     if (strEQ(d,"pwnam"))       return -KEY_getpwnam;
3790                     if (strEQ(d,"pwuid"))       return -KEY_getpwuid;
3791                     break;
3792                 case 11:
3793                     if (strEQ(d,"peername"))    return -KEY_getpeername;
3794                     if (strEQ(d,"protoent"))    return -KEY_getprotoent;
3795                     if (strEQ(d,"priority"))    return -KEY_getpriority;
3796                     break;
3797                 case 14:
3798                     if (strEQ(d,"protobyname")) return -KEY_getprotobyname;
3799                     break;
3800                 case 16:
3801                     if (strEQ(d,"protobynumber"))return -KEY_getprotobynumber;
3802                     break;
3803                 }
3804             }
3805             else if (*d == 'h') {
3806                 if (strEQ(d,"hostbyname"))      return -KEY_gethostbyname;
3807                 if (strEQ(d,"hostbyaddr"))      return -KEY_gethostbyaddr;
3808                 if (strEQ(d,"hostent"))         return -KEY_gethostent;
3809             }
3810             else if (*d == 'n') {
3811                 if (strEQ(d,"netbyname"))       return -KEY_getnetbyname;
3812                 if (strEQ(d,"netbyaddr"))       return -KEY_getnetbyaddr;
3813                 if (strEQ(d,"netent"))          return -KEY_getnetent;
3814             }
3815             else if (*d == 's') {
3816                 if (strEQ(d,"servbyname"))      return -KEY_getservbyname;
3817                 if (strEQ(d,"servbyport"))      return -KEY_getservbyport;
3818                 if (strEQ(d,"servent"))         return -KEY_getservent;
3819                 if (strEQ(d,"sockname"))        return -KEY_getsockname;
3820                 if (strEQ(d,"sockopt"))         return -KEY_getsockopt;
3821             }
3822             else if (*d == 'g') {
3823                 if (strEQ(d,"grent"))           return -KEY_getgrent;
3824                 if (strEQ(d,"grnam"))           return -KEY_getgrnam;
3825                 if (strEQ(d,"grgid"))           return -KEY_getgrgid;
3826             }
3827             else if (*d == 'l') {
3828                 if (strEQ(d,"login"))           return -KEY_getlogin;
3829             }
3830             else if (strEQ(d,"c"))              return -KEY_getc;
3831             break;
3832         }
3833         switch (len) {
3834         case 2:
3835             if (strEQ(d,"gt"))                  return -KEY_gt;
3836             if (strEQ(d,"ge"))                  return -KEY_ge;
3837             break;
3838         case 4:
3839             if (strEQ(d,"grep"))                return KEY_grep;
3840             if (strEQ(d,"goto"))                return KEY_goto;
3841             if (strEQ(d,"glob"))                return -KEY_glob;
3842             break;
3843         case 6:
3844             if (strEQ(d,"gmtime"))              return -KEY_gmtime;
3845             break;
3846         }
3847         break;
3848     case 'h':
3849         if (strEQ(d,"hex"))                     return -KEY_hex;
3850         break;
3851     case 'i':
3852         switch (len) {
3853         case 2:
3854             if (strEQ(d,"if"))                  return KEY_if;
3855             break;
3856         case 3:
3857             if (strEQ(d,"int"))                 return -KEY_int;
3858             break;
3859         case 5:
3860             if (strEQ(d,"index"))               return -KEY_index;
3861             if (strEQ(d,"ioctl"))               return -KEY_ioctl;
3862             break;
3863         }
3864         break;
3865     case 'j':
3866         if (strEQ(d,"join"))                    return -KEY_join;
3867         break;
3868     case 'k':
3869         if (len == 4) {
3870             if (strEQ(d,"keys"))                return KEY_keys;
3871             if (strEQ(d,"kill"))                return -KEY_kill;
3872         }
3873         break;
3874     case 'L':
3875         if (len == 2) {
3876             if (strEQ(d,"LT")) { deprecate(d);  return -KEY_lt;}
3877             if (strEQ(d,"LE")) { deprecate(d);  return -KEY_le;}
3878         }
3879         break;
3880     case 'l':
3881         switch (len) {
3882         case 2:
3883             if (strEQ(d,"lt"))                  return -KEY_lt;
3884             if (strEQ(d,"le"))                  return -KEY_le;
3885             if (strEQ(d,"lc"))                  return -KEY_lc;
3886             break;
3887         case 3:
3888             if (strEQ(d,"log"))                 return -KEY_log;
3889             break;
3890         case 4:
3891             if (strEQ(d,"last"))                return KEY_last;
3892             if (strEQ(d,"link"))                return -KEY_link;
3893             break;
3894         case 5:
3895             if (strEQ(d,"local"))               return KEY_local;
3896             if (strEQ(d,"lstat"))               return -KEY_lstat;
3897             break;
3898         case 6:
3899             if (strEQ(d,"length"))              return -KEY_length;
3900             if (strEQ(d,"listen"))              return -KEY_listen;
3901             break;
3902         case 7:
3903             if (strEQ(d,"lcfirst"))             return -KEY_lcfirst;
3904             break;
3905         case 9:
3906             if (strEQ(d,"localtime"))           return -KEY_localtime;
3907             break;
3908         }
3909         break;
3910     case 'm':
3911         switch (len) {
3912         case 1:                                 return KEY_m;
3913         case 2:
3914             if (strEQ(d,"my"))                  return KEY_my;
3915             break;
3916         case 3:
3917             if (strEQ(d,"map"))                 return KEY_map;
3918             break;
3919         case 5:
3920             if (strEQ(d,"mkdir"))               return -KEY_mkdir;
3921             break;
3922         case 6:
3923             if (strEQ(d,"msgctl"))              return -KEY_msgctl;
3924             if (strEQ(d,"msgget"))              return -KEY_msgget;
3925             if (strEQ(d,"msgrcv"))              return -KEY_msgrcv;
3926             if (strEQ(d,"msgsnd"))              return -KEY_msgsnd;
3927             break;
3928         }
3929         break;
3930     case 'N':
3931         if (strEQ(d,"NE")) { deprecate(d);      return -KEY_ne;}
3932         break;
3933     case 'n':
3934         if (strEQ(d,"next"))                    return KEY_next;
3935         if (strEQ(d,"ne"))                      return -KEY_ne;
3936         if (strEQ(d,"not"))                     return -KEY_not;
3937         if (strEQ(d,"no"))                      return KEY_no;
3938         break;
3939     case 'o':
3940         switch (len) {
3941         case 2:
3942             if (strEQ(d,"or"))                  return -KEY_or;
3943             break;
3944         case 3:
3945             if (strEQ(d,"ord"))                 return -KEY_ord;
3946             if (strEQ(d,"oct"))                 return -KEY_oct;
3947             break;
3948         case 4:
3949             if (strEQ(d,"open"))                return -KEY_open;
3950             break;
3951         case 7:
3952             if (strEQ(d,"opendir"))             return -KEY_opendir;
3953             break;
3954         }
3955         break;
3956     case 'p':
3957         switch (len) {
3958         case 3:
3959             if (strEQ(d,"pop"))                 return KEY_pop;
3960             if (strEQ(d,"pos"))                 return KEY_pos;
3961             break;
3962         case 4:
3963             if (strEQ(d,"push"))                return KEY_push;
3964             if (strEQ(d,"pack"))                return -KEY_pack;
3965             if (strEQ(d,"pipe"))                return -KEY_pipe;
3966             break;
3967         case 5:
3968             if (strEQ(d,"print"))               return KEY_print;
3969             break;
3970         case 6:
3971             if (strEQ(d,"printf"))              return KEY_printf;
3972             break;
3973         case 7:
3974             if (strEQ(d,"package"))             return KEY_package;
3975             break;
3976         case 9:
3977             if (strEQ(d,"prototype"))           return KEY_prototype;
3978         }
3979         break;
3980     case 'q':
3981         if (len <= 2) {
3982             if (strEQ(d,"q"))                   return KEY_q;
3983             if (strEQ(d,"qq"))                  return KEY_qq;
3984             if (strEQ(d,"qw"))                  return KEY_qw;
3985             if (strEQ(d,"qx"))                  return KEY_qx;
3986         }
3987         else if (strEQ(d,"quotemeta"))          return -KEY_quotemeta;
3988         break;
3989     case 'r':
3990         switch (len) {
3991         case 3:
3992             if (strEQ(d,"ref"))                 return -KEY_ref;
3993             break;
3994         case 4:
3995             if (strEQ(d,"read"))                return -KEY_read;
3996             if (strEQ(d,"rand"))                return -KEY_rand;
3997             if (strEQ(d,"recv"))                return -KEY_recv;
3998             if (strEQ(d,"redo"))                return KEY_redo;
3999             break;
4000         case 5:
4001             if (strEQ(d,"rmdir"))               return -KEY_rmdir;
4002             if (strEQ(d,"reset"))               return -KEY_reset;
4003             break;
4004         case 6:
4005             if (strEQ(d,"return"))              return KEY_return;
4006             if (strEQ(d,"rename"))              return -KEY_rename;
4007             if (strEQ(d,"rindex"))              return -KEY_rindex;
4008             break;
4009         case 7:
4010             if (strEQ(d,"require"))             return -KEY_require;
4011             if (strEQ(d,"reverse"))             return -KEY_reverse;
4012             if (strEQ(d,"readdir"))             return -KEY_readdir;
4013             break;
4014         case 8:
4015             if (strEQ(d,"readlink"))            return -KEY_readlink;
4016             if (strEQ(d,"readline"))            return -KEY_readline;
4017             if (strEQ(d,"readpipe"))            return -KEY_readpipe;
4018             break;
4019         case 9:
4020             if (strEQ(d,"rewinddir"))           return -KEY_rewinddir;
4021             break;
4022         }
4023         break;
4024     case 's':
4025         switch (d[1]) {
4026         case 0:                                 return KEY_s;
4027         case 'c':
4028             if (strEQ(d,"scalar"))              return KEY_scalar;
4029             break;
4030         case 'e':
4031             switch (len) {
4032             case 4:
4033                 if (strEQ(d,"seek"))            return -KEY_seek;
4034                 if (strEQ(d,"send"))            return -KEY_send;
4035                 break;
4036             case 5:
4037                 if (strEQ(d,"semop"))           return -KEY_semop;
4038                 break;
4039             case 6:
4040                 if (strEQ(d,"select"))          return -KEY_select;
4041                 if (strEQ(d,"semctl"))          return -KEY_semctl;
4042                 if (strEQ(d,"semget"))          return -KEY_semget;
4043                 break;
4044             case 7:
4045                 if (strEQ(d,"setpgrp"))         return -KEY_setpgrp;
4046                 if (strEQ(d,"seekdir"))         return -KEY_seekdir;
4047                 break;
4048             case 8:
4049                 if (strEQ(d,"setpwent"))        return -KEY_setpwent;
4050                 if (strEQ(d,"setgrent"))        return -KEY_setgrent;
4051                 break;
4052             case 9:
4053                 if (strEQ(d,"setnetent"))       return -KEY_setnetent;
4054                 break;
4055             case 10:
4056                 if (strEQ(d,"setsockopt"))      return -KEY_setsockopt;
4057                 if (strEQ(d,"sethostent"))      return -KEY_sethostent;
4058                 if (strEQ(d,"setservent"))      return -KEY_setservent;
4059                 break;
4060             case 11:
4061                 if (strEQ(d,"setpriority"))     return -KEY_setpriority;
4062                 if (strEQ(d,"setprotoent"))     return -KEY_setprotoent;
4063                 break;
4064             }
4065             break;
4066         case 'h':
4067             switch (len) {
4068             case 5:
4069                 if (strEQ(d,"shift"))           return KEY_shift;
4070                 break;
4071             case 6:
4072                 if (strEQ(d,"shmctl"))          return -KEY_shmctl;
4073                 if (strEQ(d,"shmget"))          return -KEY_shmget;
4074                 break;
4075             case 7:
4076                 if (strEQ(d,"shmread"))         return -KEY_shmread;
4077                 break;
4078             case 8:
4079                 if (strEQ(d,"shmwrite"))        return -KEY_shmwrite;
4080                 if (strEQ(d,"shutdown"))        return -KEY_shutdown;
4081                 break;
4082             }
4083             break;
4084         case 'i':
4085             if (strEQ(d,"sin"))                 return -KEY_sin;
4086             break;
4087         case 'l':
4088             if (strEQ(d,"sleep"))               return -KEY_sleep;
4089             break;
4090         case 'o':
4091             if (strEQ(d,"sort"))                return KEY_sort;
4092             if (strEQ(d,"socket"))              return -KEY_socket;
4093             if (strEQ(d,"socketpair"))          return -KEY_socketpair;
4094             break;
4095         case 'p':
4096             if (strEQ(d,"split"))               return KEY_split;
4097             if (strEQ(d,"sprintf"))             return -KEY_sprintf;
4098             if (strEQ(d,"splice"))              return KEY_splice;
4099             break;
4100         case 'q':
4101             if (strEQ(d,"sqrt"))                return -KEY_sqrt;
4102             break;
4103         case 'r':
4104             if (strEQ(d,"srand"))               return -KEY_srand;
4105             break;
4106         case 't':
4107             if (strEQ(d,"stat"))                return -KEY_stat;
4108             if (strEQ(d,"study"))               return KEY_study;
4109             break;
4110         case 'u':
4111             if (strEQ(d,"substr"))              return -KEY_substr;
4112             if (strEQ(d,"sub"))                 return KEY_sub;
4113             break;
4114         case 'y':
4115             switch (len) {
4116             case 6:
4117                 if (strEQ(d,"system"))          return -KEY_system;
4118                 break;
4119             case 7:
4120                 if (strEQ(d,"sysopen"))         return -KEY_sysopen;
4121                 if (strEQ(d,"sysread"))         return -KEY_sysread;
4122                 if (strEQ(d,"symlink"))         return -KEY_symlink;
4123                 if (strEQ(d,"syscall"))         return -KEY_syscall;
4124                 break;
4125             case 8:
4126                 if (strEQ(d,"syswrite"))        return -KEY_syswrite;
4127                 break;
4128             }
4129             break;
4130         }
4131         break;
4132     case 't':
4133         switch (len) {
4134         case 2:
4135             if (strEQ(d,"tr"))                  return KEY_tr;
4136             break;
4137         case 3:
4138             if (strEQ(d,"tie"))                 return KEY_tie;
4139             break;
4140         case 4:
4141             if (strEQ(d,"tell"))                return -KEY_tell;
4142             if (strEQ(d,"tied"))                return KEY_tied;
4143             if (strEQ(d,"time"))                return -KEY_time;
4144             break;
4145         case 5:
4146             if (strEQ(d,"times"))               return -KEY_times;
4147             break;
4148         case 7:
4149             if (strEQ(d,"telldir"))             return -KEY_telldir;
4150             break;
4151         case 8:
4152             if (strEQ(d,"truncate"))            return -KEY_truncate;
4153             break;
4154         }
4155         break;
4156     case 'u':
4157         switch (len) {
4158         case 2:
4159             if (strEQ(d,"uc"))                  return -KEY_uc;
4160             break;
4161         case 3:
4162             if (strEQ(d,"use"))                 return KEY_use;
4163             break;
4164         case 5:
4165             if (strEQ(d,"undef"))               return KEY_undef;
4166             if (strEQ(d,"until"))               return KEY_until;
4167             if (strEQ(d,"untie"))               return KEY_untie;
4168             if (strEQ(d,"utime"))               return -KEY_utime;
4169             if (strEQ(d,"umask"))               return -KEY_umask;
4170             break;
4171         case 6:
4172             if (strEQ(d,"unless"))              return KEY_unless;
4173             if (strEQ(d,"unpack"))              return -KEY_unpack;
4174             if (strEQ(d,"unlink"))              return -KEY_unlink;
4175             break;
4176         case 7:
4177             if (strEQ(d,"unshift"))             return KEY_unshift;
4178             if (strEQ(d,"ucfirst"))             return -KEY_ucfirst;
4179             break;
4180         }
4181         break;
4182     case 'v':
4183         if (strEQ(d,"values"))                  return -KEY_values;
4184         if (strEQ(d,"vec"))                     return -KEY_vec;
4185         break;
4186     case 'w':
4187         switch (len) {
4188         case 4:
4189             if (strEQ(d,"warn"))                return -KEY_warn;
4190             if (strEQ(d,"wait"))                return -KEY_wait;
4191             break;
4192         case 5:
4193             if (strEQ(d,"while"))               return KEY_while;
4194             if (strEQ(d,"write"))               return -KEY_write;
4195             break;
4196         case 7:
4197             if (strEQ(d,"waitpid"))             return -KEY_waitpid;
4198             break;
4199         case 9:
4200             if (strEQ(d,"wantarray"))           return -KEY_wantarray;
4201             break;
4202         }
4203         break;
4204     case 'x':
4205         if (len == 1)                           return -KEY_x;
4206         if (strEQ(d,"xor"))                     return -KEY_xor;
4207         break;
4208     case 'y':
4209         if (len == 1)                           return KEY_y;
4210         break;
4211     case 'z':
4212         break;
4213     }
4214     return 0;
4215 }
4216
4217 static void
4218 checkcomma(s,name,what)
4219 register char *s;
4220 char *name;
4221 char *what;
4222 {
4223     char *w;
4224
4225     if (dowarn && *s == ' ' && s[1] == '(') {   /* XXX gotta be a better way */
4226         int level = 1;
4227         for (w = s+2; *w && level; w++) {
4228             if (*w == '(')
4229                 ++level;
4230             else if (*w == ')')
4231                 --level;
4232         }
4233         if (*w)
4234             for (; *w && isSPACE(*w); w++) ;
4235         if (!*w || !strchr(";|})]oa!=", *w))    /* an advisory hack only... */
4236             warn("%s (...) interpreted as function",name);
4237     }
4238     while (s < bufend && isSPACE(*s))
4239         s++;
4240     if (*s == '(')
4241         s++;
4242     while (s < bufend && isSPACE(*s))
4243         s++;
4244     if (isIDFIRST(*s)) {
4245         w = s++;
4246         while (isALNUM(*s))
4247             s++;
4248         while (s < bufend && isSPACE(*s))
4249             s++;
4250         if (*s == ',') {
4251             int kw;
4252             *s = '\0';
4253             kw = keyword(w, s - w) || perl_get_cv(w, FALSE) != 0;
4254             *s = ',';
4255             if (kw)
4256                 return;
4257             croak("No comma allowed after %s", what);
4258         }
4259     }
4260 }
4261
4262 static char *
4263 scan_word(s, dest, allow_package, slp)
4264 register char *s;
4265 char *dest;
4266 int allow_package;
4267 STRLEN *slp;
4268 {
4269     register char *d = dest;
4270     for (;;) {
4271         if (isALNUM(*s))
4272             *d++ = *s++;
4273         else if (*s == '\'' && allow_package && isIDFIRST(s[1])) {
4274             *d++ = ':';
4275             *d++ = ':';
4276             s++;
4277         }
4278         else if (*s == ':' && s[1] == ':' && allow_package && isIDFIRST(s[2])) {
4279             *d++ = *s++;
4280             *d++ = *s++;
4281         }
4282         else {
4283             *d = '\0';
4284             *slp = d - dest;
4285             return s;
4286         }
4287     }
4288 }
4289
4290 static char *
4291 scan_ident(s,send,dest,ck_uni)
4292 register char *s;
4293 register char *send;
4294 char *dest;
4295 I32 ck_uni;
4296 {
4297     register char *d;
4298     char *bracket = 0;
4299     char funny = *s++;
4300
4301     if (lex_brackets == 0)
4302         lex_fakebrack = 0;
4303     if (isSPACE(*s))
4304         s = skipspace(s);
4305     d = dest;
4306     if (isDIGIT(*s)) {
4307         while (isDIGIT(*s))
4308             *d++ = *s++;
4309     }
4310     else {
4311         for (;;) {
4312             if (isALNUM(*s))
4313                 *d++ = *s++;
4314             else if (*s == '\'' && isIDFIRST(s[1])) {
4315                 *d++ = ':';
4316                 *d++ = ':';
4317                 s++;
4318             }
4319             else if (*s == ':' && s[1] == ':') {
4320                 *d++ = *s++;
4321                 *d++ = *s++;
4322             }
4323             else
4324                 break;
4325         }
4326     }
4327     *d = '\0';
4328     d = dest;
4329     if (*d) {
4330         if (lex_state != LEX_NORMAL)
4331             lex_state = LEX_INTERPENDMAYBE;
4332         return s;
4333     }
4334     if (*s == '$' && s[1] &&
4335       (isALPHA(s[1]) || strchr("$_{", s[1]) || strnEQ(s+1,"::",2)) )
4336         return s;
4337     if (*s == '{') {
4338         bracket = s;
4339         s++;
4340     }
4341     else if (ck_uni)
4342         check_uni();
4343     if (s < send)
4344         *d = *s++;
4345     d[1] = '\0';
4346     if (*d == '^' && *s && (isUPPER(*s) || strchr("[\\]^_?", *s))) {
4347         *d = toCTRL(*s);
4348         s++;
4349     }
4350     if (bracket) {
4351         if (isSPACE(s[-1])) {
4352             while (s < send) {
4353                 char ch = *s++;
4354                 if (ch != ' ' && ch != '\t') {
4355                     *d = ch;
4356                     break;
4357                 }
4358             }
4359         }
4360         if (isIDFIRST(*d)) {
4361             d++;
4362             while (isALNUM(*s) || *s == ':')
4363                 *d++ = *s++;
4364             *d = '\0';
4365             while (s < send && (*s == ' ' || *s == '\t')) s++;
4366             if ((*s == '[' || (*s == '{' && strNE(dest, "sub")))) {
4367                 if (dowarn && keyword(dest, d - dest)) {
4368                     char *brack = *s == '[' ? "[...]" : "{...}";
4369                     warn("Ambiguous use of %c{%s%s} resolved to %c%s%s",
4370                         funny, dest, brack, funny, dest, brack);
4371                 }
4372                 lex_fakebrack = lex_brackets+1;
4373                 bracket++;
4374                 lex_brackstack[lex_brackets++] = XOPERATOR;
4375                 return s;
4376             }
4377         }
4378         if (*s == '}') {
4379             s++;
4380             if (lex_state == LEX_INTERPNORMAL && !lex_brackets)
4381                 lex_state = LEX_INTERPEND;
4382             if (funny == '#')
4383                 funny = '@';
4384             if (dowarn &&
4385               (keyword(dest, d - dest) || perl_get_cv(dest, FALSE)))
4386                 warn("Ambiguous use of %c{%s} resolved to %c%s",
4387                     funny, dest, funny, dest);
4388         }
4389         else {
4390             s = bracket;                /* let the parser handle it */
4391             *dest = '\0';
4392         }
4393     }
4394     else if (lex_state == LEX_INTERPNORMAL && !lex_brackets && !intuit_more(s))
4395         lex_state = LEX_INTERPEND;
4396     return s;
4397 }
4398
4399 void pmflag(pmfl,ch)
4400 U16* pmfl;
4401 int ch;
4402 {
4403     if (ch == 'i')
4404         *pmfl |= PMf_FOLD;
4405     else if (ch == 'g')
4406         *pmfl |= PMf_GLOBAL;
4407     else if (ch == 'o')
4408         *pmfl |= PMf_KEEP;
4409     else if (ch == 'm')
4410         *pmfl |= PMf_MULTILINE;
4411     else if (ch == 's')
4412         *pmfl |= PMf_SINGLELINE;
4413     else if (ch == 'x')
4414         *pmfl |= PMf_EXTENDED;
4415 }
4416
4417 static char *
4418 scan_pat(start)
4419 char *start;
4420 {
4421     PMOP *pm;
4422     char *s;
4423
4424     s = scan_str(start);
4425     if (!s) {
4426         if (lex_stuff)
4427             SvREFCNT_dec(lex_stuff);
4428         lex_stuff = Nullsv;
4429         croak("Search pattern not terminated");
4430     }
4431
4432     pm = (PMOP*)newPMOP(OP_MATCH, 0);
4433     if (multi_open == '?')
4434         pm->op_pmflags |= PMf_ONCE;
4435     while (*s && strchr("iogmsx", *s))
4436         pmflag(&pm->op_pmflags,*s++);
4437     pm->op_pmpermflags = pm->op_pmflags;
4438
4439     lex_op = (OP*)pm;
4440     yylval.ival = OP_MATCH;
4441     return s;
4442 }
4443
4444 static char *
4445 scan_subst(start)
4446 char *start;
4447 {
4448     register char *s;
4449     register PMOP *pm;
4450     I32 first_start;
4451     I32 es = 0;
4452
4453     yylval.ival = OP_NULL;
4454
4455     s = scan_str(start);
4456
4457     if (!s) {
4458         if (lex_stuff)
4459             SvREFCNT_dec(lex_stuff);
4460         lex_stuff = Nullsv;
4461         croak("Substitution pattern not terminated");
4462     }
4463
4464     if (s[-1] == multi_open)
4465         s--;
4466
4467     first_start = multi_start;
4468     s = scan_str(s);
4469     if (!s) {
4470         if (lex_stuff)
4471             SvREFCNT_dec(lex_stuff);
4472         lex_stuff = Nullsv;
4473         if (lex_repl)
4474             SvREFCNT_dec(lex_repl);
4475         lex_repl = Nullsv;
4476         croak("Substitution replacement not terminated");
4477     }
4478     multi_start = first_start;  /* so whole substitution is taken together */
4479
4480     pm = (PMOP*)newPMOP(OP_SUBST, 0);
4481     while (*s && strchr("iogmsex", *s)) {
4482         if (*s == 'e') {
4483             s++;
4484             es++;
4485         }
4486         else
4487             pmflag(&pm->op_pmflags,*s++);
4488     }
4489
4490     if (es) {
4491         SV *repl;
4492         pm->op_pmflags |= PMf_EVAL;
4493         repl = newSVpv("",0);
4494         while (es-- > 0)
4495             sv_catpv(repl, es ? "eval " : "do ");
4496         sv_catpvn(repl, "{ ", 2);
4497         sv_catsv(repl, lex_repl);
4498         sv_catpvn(repl, " };", 2);
4499         SvCOMPILED_on(repl);
4500         SvREFCNT_dec(lex_repl);
4501         lex_repl = repl;
4502     }
4503
4504     pm->op_pmpermflags = pm->op_pmflags;
4505     lex_op = (OP*)pm;
4506     yylval.ival = OP_SUBST;
4507     return s;
4508 }
4509
4510 void
4511 hoistmust(pm)
4512 register PMOP *pm;
4513 {
4514     if (!pm->op_pmshort && pm->op_pmregexp->regstart &&
4515         (!pm->op_pmregexp->regmust || pm->op_pmregexp->reganch & ROPT_ANCH)
4516        ) {
4517         if (!(pm->op_pmregexp->reganch & ROPT_ANCH))
4518             pm->op_pmflags |= PMf_SCANFIRST;
4519         pm->op_pmshort = SvREFCNT_inc(pm->op_pmregexp->regstart);
4520         pm->op_pmslen = SvCUR(pm->op_pmshort);
4521     }
4522     else if (pm->op_pmregexp->regmust) {/* is there a better short-circuit? */
4523         if (pm->op_pmshort &&
4524           sv_eq(pm->op_pmshort,pm->op_pmregexp->regmust))
4525         {
4526             if (pm->op_pmflags & PMf_SCANFIRST) {
4527                 SvREFCNT_dec(pm->op_pmshort);
4528                 pm->op_pmshort = Nullsv;
4529             }
4530             else {
4531                 SvREFCNT_dec(pm->op_pmregexp->regmust);
4532                 pm->op_pmregexp->regmust = Nullsv;
4533                 return;
4534             }
4535         }
4536         /* promote the better string */
4537         if ((!pm->op_pmshort && !(pm->op_pmregexp->reganch & ROPT_ANCH)) ||
4538             ((pm->op_pmflags & PMf_SCANFIRST) &&
4539              (SvCUR(pm->op_pmshort) < SvCUR(pm->op_pmregexp->regmust)))) {
4540             SvREFCNT_dec(pm->op_pmshort);               /* ok if null */
4541             pm->op_pmshort = pm->op_pmregexp->regmust;
4542             pm->op_pmslen = SvCUR(pm->op_pmshort);
4543             pm->op_pmregexp->regmust = Nullsv;
4544             pm->op_pmflags |= PMf_SCANFIRST;
4545         }
4546     }
4547 }
4548
4549 static char *
4550 scan_trans(start)
4551 char *start;
4552 {
4553     register char* s;
4554     OP *op;
4555     short *tbl;
4556     I32 squash;
4557     I32 delete;
4558     I32 complement;
4559
4560     yylval.ival = OP_NULL;
4561
4562     s = scan_str(start);
4563     if (!s) {
4564         if (lex_stuff)
4565             SvREFCNT_dec(lex_stuff);
4566         lex_stuff = Nullsv;
4567         croak("Translation pattern not terminated");
4568     }
4569     if (s[-1] == multi_open)
4570         s--;
4571
4572     s = scan_str(s);
4573     if (!s) {
4574         if (lex_stuff)
4575             SvREFCNT_dec(lex_stuff);
4576         lex_stuff = Nullsv;
4577         if (lex_repl)
4578             SvREFCNT_dec(lex_repl);
4579         lex_repl = Nullsv;
4580         croak("Translation replacement not terminated");
4581     }
4582
4583     New(803,tbl,256,short);
4584     op = newPVOP(OP_TRANS, 0, (char*)tbl);
4585
4586     complement = delete = squash = 0;
4587     while (*s == 'c' || *s == 'd' || *s == 's') {
4588         if (*s == 'c')
4589             complement = OPpTRANS_COMPLEMENT;
4590         else if (*s == 'd')
4591             delete = OPpTRANS_DELETE;
4592         else
4593             squash = OPpTRANS_SQUASH;
4594         s++;
4595     }
4596     op->op_private = delete|squash|complement;
4597
4598     lex_op = op;
4599     yylval.ival = OP_TRANS;
4600     return s;
4601 }
4602
4603 static char *
4604 scan_heredoc(s)
4605 register char *s;
4606 {
4607     SV *herewas;
4608     I32 op_type = OP_SCALAR;
4609     I32 len;
4610     SV *tmpstr;
4611     char term;
4612     register char *d;
4613     char *peek;
4614     int outer = (rsfp && !lex_inwhat);
4615
4616     s += 2;
4617     d = tokenbuf;
4618     if (!outer)
4619         *d++ = '\n';
4620     for (peek = s; *peek == ' ' || *peek == '\t'; peek++) ;
4621     if (*peek && strchr("`'\"",*peek)) {
4622         s = peek;
4623         term = *s++;
4624         s = cpytill(d,s,bufend,term,&len);
4625         if (s < bufend)
4626             s++;
4627         d += len;
4628     }
4629     else {
4630         if (*s == '\\')
4631             s++, term = '\'';
4632         else
4633             term = '"';
4634         if (!isALNUM(*s))
4635             deprecate("bare << to mean <<\"\"");
4636         while (isALNUM(*s))
4637             *d++ = *s++;
4638     }                           /* assuming tokenbuf won't clobber */
4639     *d++ = '\n';
4640     *d = '\0';
4641     len = d - tokenbuf;
4642     d = "\n";
4643     if (outer || !(d=ninstr(s,bufend,d,d+1)))
4644         herewas = newSVpv(s,bufend-s);
4645     else
4646         s--, herewas = newSVpv(s,d-s);
4647     s += SvCUR(herewas);
4648
4649     tmpstr = NEWSV(87,80);
4650     sv_upgrade(tmpstr, SVt_PVIV);
4651     if (term == '\'') {
4652         op_type = OP_CONST;
4653         SvIVX(tmpstr) = -1;
4654     }
4655     else if (term == '`') {
4656         op_type = OP_BACKTICK;
4657         SvIVX(tmpstr) = '\\';
4658     }
4659
4660     CLINE;
4661     multi_start = curcop->cop_line;
4662     multi_open = multi_close = '<';
4663     term = *tokenbuf;
4664     if (!outer) {
4665         d = s;
4666         while (s < bufend &&
4667           (*s != term || memNE(s,tokenbuf,len)) ) {
4668             if (*s++ == '\n')
4669                 curcop->cop_line++;
4670         }
4671         if (s >= bufend) {
4672             curcop->cop_line = multi_start;
4673             missingterm(tokenbuf);
4674         }
4675         sv_setpvn(tmpstr,d+1,s-d);
4676         s += len - 1;
4677         sv_catpvn(herewas,s,bufend-s);
4678         sv_setsv(linestr,herewas);
4679         oldoldbufptr = oldbufptr = bufptr = s = linestart = SvPVX(linestr);
4680         bufend = SvPVX(linestr) + SvCUR(linestr);
4681     }
4682     else
4683         sv_setpvn(tmpstr,"",0);   /* avoid "uninitialized" warning */
4684     while (s >= bufend) {       /* multiple line string? */
4685         if (!outer ||
4686          !(oldoldbufptr = oldbufptr = s = linestart = filter_gets(linestr, rsfp, 0))) {
4687             curcop->cop_line = multi_start;
4688             missingterm(tokenbuf);
4689         }
4690         curcop->cop_line++;
4691         if (perldb && curstash != debstash) {
4692             SV *sv = NEWSV(88,0);
4693
4694             sv_upgrade(sv, SVt_PVMG);
4695             sv_setsv(sv,linestr);
4696             av_store(GvAV(curcop->cop_filegv),
4697               (I32)curcop->cop_line,sv);
4698         }
4699         bufend = SvPVX(linestr) + SvCUR(linestr);
4700         if (*s == term && memEQ(s,tokenbuf,len)) {
4701             s = bufend - 1;
4702             *s = ' ';
4703             sv_catsv(linestr,herewas);
4704             bufend = SvPVX(linestr) + SvCUR(linestr);
4705         }
4706         else {
4707             s = bufend;
4708             sv_catsv(tmpstr,linestr);
4709         }
4710     }
4711     multi_end = curcop->cop_line;
4712     s++;
4713     if (SvCUR(tmpstr) + 5 < SvLEN(tmpstr)) {
4714         SvLEN_set(tmpstr, SvCUR(tmpstr) + 1);
4715         Renew(SvPVX(tmpstr), SvLEN(tmpstr), char);
4716     }
4717     SvREFCNT_dec(herewas);
4718     lex_stuff = tmpstr;
4719     yylval.ival = op_type;
4720     return s;
4721 }
4722
4723 static char *
4724 scan_inputsymbol(start)
4725 char *start;
4726 {
4727     register char *s = start;
4728     register char *d;
4729     I32 len;
4730
4731     d = tokenbuf;
4732     s = cpytill(d, s+1, bufend, '>', &len);
4733     if (s < bufend)
4734         s++;
4735     else
4736         croak("Unterminated <> operator");
4737
4738     if (*d == '$' && d[1]) d++;
4739     while (*d && (isALNUM(*d) || *d == '\'' || *d == ':'))
4740         d++;
4741     if (d - tokenbuf != len) {
4742         yylval.ival = OP_GLOB;
4743         set_csh();
4744         s = scan_str(start);
4745         if (!s)
4746             croak("Glob not terminated");
4747         return s;
4748     }
4749     else {
4750         d = tokenbuf;
4751         if (!len)
4752             (void)strcpy(d,"ARGV");
4753         if (*d == '$') {
4754             I32 tmp;
4755             if (tmp = pad_findmy(d)) {
4756                 OP *op = newOP(OP_PADSV, 0);
4757                 op->op_targ = tmp;
4758                 lex_op = (OP*)newUNOP(OP_READLINE, 0, newUNOP(OP_RV2GV, 0, op));
4759             }
4760             else {
4761                 GV *gv = gv_fetchpv(d+1,TRUE, SVt_PV);
4762                 lex_op = (OP*)newUNOP(OP_READLINE, 0,
4763                                         newUNOP(OP_RV2GV, 0,
4764                                             newUNOP(OP_RV2SV, 0,
4765                                                 newGVOP(OP_GV, 0, gv))));
4766             }
4767             yylval.ival = OP_NULL;
4768         }
4769         else {
4770             GV *gv = gv_fetchpv(d,TRUE, SVt_PVIO);
4771             lex_op = (OP*)newUNOP(OP_READLINE, 0, newGVOP(OP_GV, 0, gv));
4772             yylval.ival = OP_NULL;
4773         }
4774     }
4775     return s;
4776 }
4777
4778 static char *
4779 scan_str(start)
4780 char *start;
4781 {
4782     SV *sv;
4783     char *tmps;
4784     register char *s = start;
4785     register char term;
4786     register char *to;
4787     I32 brackets = 1;
4788
4789     if (isSPACE(*s))
4790         s = skipspace(s);
4791     CLINE;
4792     term = *s;
4793     multi_start = curcop->cop_line;
4794     multi_open = term;
4795     if (term && (tmps = strchr("([{< )]}> )]}>",term)))
4796         term = tmps[5];
4797     multi_close = term;
4798
4799     sv = NEWSV(87,80);
4800     sv_upgrade(sv, SVt_PVIV);
4801     SvIVX(sv) = term;
4802     (void)SvPOK_only(sv);               /* validate pointer */
4803     s++;
4804     for (;;) {
4805         SvGROW(sv, SvCUR(sv) + (bufend - s) + 1);
4806         to = SvPVX(sv)+SvCUR(sv);
4807         if (multi_open == multi_close) {
4808             for (; s < bufend; s++,to++) {
4809                 if (*s == '\n' && !rsfp)
4810                     curcop->cop_line++;
4811                 if (*s == '\\' && s+1 < bufend && term != '\\') {
4812                     if (s[1] == term)
4813                         s++;
4814                     else
4815                         *to++ = *s++;
4816                 }
4817                 else if (*s == term)
4818                     break;
4819                 *to = *s;
4820             }
4821         }
4822         else {
4823             for (; s < bufend; s++,to++) {
4824                 if (*s == '\n' && !rsfp)
4825                     curcop->cop_line++;
4826                 if (*s == '\\' && s+1 < bufend && term != '\\') {
4827                     if (s[1] == term)
4828                         s++;
4829                     else
4830                         *to++ = *s++;
4831                 }
4832                 else if (*s == term && --brackets <= 0)
4833                     break;
4834                 else if (*s == multi_open)
4835                     brackets++;
4836                 *to = *s;
4837             }
4838         }
4839         *to = '\0';
4840         SvCUR_set(sv, to - SvPVX(sv));
4841
4842     if (s < bufend) break;      /* string ends on this line? */
4843
4844         if (!rsfp ||
4845          !(oldoldbufptr = oldbufptr = s = linestart = filter_gets(linestr, rsfp, 0))) {
4846             sv_free(sv);
4847             curcop->cop_line = multi_start;
4848             return Nullch;
4849         }
4850         curcop->cop_line++;
4851         if (perldb && curstash != debstash) {
4852             SV *sv = NEWSV(88,0);
4853
4854             sv_upgrade(sv, SVt_PVMG);
4855             sv_setsv(sv,linestr);
4856             av_store(GvAV(curcop->cop_filegv),
4857               (I32)curcop->cop_line, sv);
4858         }
4859         bufend = SvPVX(linestr) + SvCUR(linestr);
4860     }
4861     multi_end = curcop->cop_line;
4862     s++;
4863     if (SvCUR(sv) + 5 < SvLEN(sv)) {
4864         SvLEN_set(sv, SvCUR(sv) + 1);
4865         Renew(SvPVX(sv), SvLEN(sv), char);
4866     }
4867     if (lex_stuff)
4868         lex_repl = sv;
4869     else
4870         lex_stuff = sv;
4871     return s;
4872 }
4873
4874 char *
4875 scan_num(start)
4876 char *start;
4877 {
4878     register char *s = start;
4879     register char *d;
4880     I32 tryi32;
4881     double value;
4882     SV *sv;
4883     I32 floatit;
4884     char *lastub = 0;
4885
4886     switch (*s) {
4887     default:
4888         croak("panic: scan_num");
4889     case '0':
4890         {
4891             UV u;
4892             I32 shift;
4893             bool overflowed = FALSE;
4894
4895             if (s[1] == 'x') {
4896                 shift = 4;
4897                 s += 2;
4898             }
4899             else if (s[1] == '.')
4900                 goto decimal;
4901             else
4902                 shift = 3;
4903             u = 0;
4904             for (;;) {
4905                 UV n, b;
4906
4907                 switch (*s) {
4908                 default:
4909                     goto out;
4910                 case '_':
4911                     s++;
4912                     break;
4913                 case '8': case '9':
4914                     if (shift != 4)
4915                         yyerror("Illegal octal digit");
4916                     /* FALL THROUGH */
4917                 case '0': case '1': case '2': case '3': case '4':
4918                 case '5': case '6': case '7':
4919                     b = *s++ & 15;
4920                     goto digit;
4921                 case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
4922                 case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
4923                     if (shift != 4)
4924                         goto out;
4925                     b = (*s++ & 7) + 9;
4926                   digit:
4927                     n = u << shift;
4928                     if (!overflowed && (n >> shift) != u) {
4929                         warn("Integer overflow in %s number",
4930                              (shift == 4) ? "hex" : "octal");
4931                         overflowed = TRUE;
4932                     }
4933                     u = n | b;
4934                     break;
4935                 }
4936             }
4937           out:
4938             sv = NEWSV(92,0);
4939             sv_setuv(sv, u);
4940         }
4941         break;
4942     case '1': case '2': case '3': case '4': case '5':
4943     case '6': case '7': case '8': case '9': case '.':
4944       decimal:
4945         d = tokenbuf;
4946         floatit = FALSE;
4947         while (isDIGIT(*s) || *s == '_') {
4948             if (*s == '_') {
4949                 if (dowarn && lastub && s - lastub != 3)
4950                     warn("Misplaced _ in number");
4951                 lastub = ++s;
4952             }
4953             else
4954                 *d++ = *s++;
4955         }
4956         if (dowarn && lastub && s - lastub != 3)
4957             warn("Misplaced _ in number");
4958         if (*s == '.' && s[1] != '.') {
4959             floatit = TRUE;
4960             *d++ = *s++;
4961             while (isDIGIT(*s) || *s == '_') {
4962                 if (*s == '_')
4963                     s++;
4964                 else
4965                     *d++ = *s++;
4966             }
4967         }
4968         if (*s && strchr("eE",*s) && strchr("+-0123456789",s[1])) {
4969             floatit = TRUE;
4970             s++;
4971             *d++ = 'e';         /* At least some Mach atof()s don't grok 'E' */
4972             if (*s == '+' || *s == '-')
4973                 *d++ = *s++;
4974             while (isDIGIT(*s))
4975                 *d++ = *s++;
4976         }
4977         *d = '\0';
4978         sv = NEWSV(92,0);
4979         SET_NUMERIC_STANDARD();
4980         value = atof(tokenbuf);
4981         tryi32 = I_32(value);
4982         if (!floatit && (double)tryi32 == value)
4983             sv_setiv(sv,tryi32);
4984         else
4985             sv_setnv(sv,value);
4986         break;
4987     }
4988
4989     yylval.opval = newSVOP(OP_CONST, 0, sv);
4990
4991     return s;
4992 }
4993
4994 static char *
4995 scan_formline(s)
4996 register char *s;
4997 {
4998     register char *eol;
4999     register char *t;
5000     SV *stuff = newSVpv("",0);
5001     bool needargs = FALSE;
5002
5003     while (!needargs) {
5004         if (*s == '.' || *s == '}') {
5005             /*SUPPRESS 530*/
5006             for (t = s+1; *t == ' ' || *t == '\t'; t++) ;
5007             if (*t == '\n')
5008                 break;
5009         }
5010         if (in_eval && !rsfp) {
5011             eol = strchr(s,'\n');
5012             if (!eol++)
5013                 eol = bufend;
5014         }
5015         else
5016             eol = bufend = SvPVX(linestr) + SvCUR(linestr);
5017         if (*s != '#') {
5018             for (t = s; t < eol; t++) {
5019                 if (*t == '~' && t[1] == '~' && SvCUR(stuff)) {
5020                     needargs = FALSE;
5021                     goto enough;        /* ~~ must be first line in formline */
5022                 }
5023                 if (*t == '@' || *t == '^')
5024                     needargs = TRUE;
5025             }
5026             sv_catpvn(stuff, s, eol-s);
5027         }
5028         s = eol;
5029         if (rsfp) {
5030             s = filter_gets(linestr, rsfp, 0);
5031             oldoldbufptr = oldbufptr = bufptr = linestart = SvPVX(linestr);
5032             bufend = bufptr + SvCUR(linestr);
5033             if (!s) {
5034                 s = bufptr;
5035                 yyerror("Format not terminated");
5036                 break;
5037             }
5038         }
5039         incline(s);
5040     }
5041   enough:
5042     if (SvCUR(stuff)) {
5043         expect = XTERM;
5044         if (needargs) {
5045             lex_state = LEX_NORMAL;
5046             nextval[nexttoke].ival = 0;
5047             force_next(',');
5048         }
5049         else
5050             lex_state = LEX_FORMLINE;
5051         nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, stuff);
5052         force_next(THING);
5053         nextval[nexttoke].ival = OP_FORMLINE;
5054         force_next(LSTOP);
5055     }
5056     else {
5057         SvREFCNT_dec(stuff);
5058         lex_formbrack = 0;
5059         bufptr = s;
5060     }
5061     return s;
5062 }
5063
5064 static void
5065 set_csh()
5066 {
5067 #ifdef CSH
5068     if (!cshlen)
5069         cshlen = strlen(cshname);
5070 #endif
5071 }
5072
5073 int
5074 start_subparse(is_format, flags)
5075 I32 is_format;
5076 U32 flags;
5077 {
5078     int oldsavestack_ix = savestack_ix;
5079     CV* outsidecv = compcv;
5080     AV* comppadlist;
5081
5082     if (compcv) {
5083         assert(SvTYPE(compcv) == SVt_PVCV);
5084     }
5085     save_I32(&subline);
5086     save_item(subname);
5087     SAVEI32(padix);
5088     SAVESPTR(curpad);
5089     SAVESPTR(comppad);
5090     SAVESPTR(comppad_name);
5091     SAVESPTR(compcv);
5092     SAVEI32(comppad_name_fill);
5093     SAVEI32(min_intro_pending);
5094     SAVEI32(max_intro_pending);
5095     SAVEI32(pad_reset_pending);
5096
5097     compcv = (CV*)NEWSV(1104,0);
5098     sv_upgrade((SV *)compcv, is_format ? SVt_PVFM : SVt_PVCV);
5099     CvFLAGS(compcv) |= flags;
5100
5101     comppad = newAV();
5102     comppad_name = newAV();
5103     comppad_name_fill = 0;
5104     min_intro_pending = 0;
5105     av_push(comppad, Nullsv);
5106     curpad = AvARRAY(comppad);
5107     padix = 0;
5108     subline = curcop->cop_line;
5109
5110     comppadlist = newAV();
5111     AvREAL_off(comppadlist);
5112     av_store(comppadlist, 0, (SV*)comppad_name);
5113     av_store(comppadlist, 1, (SV*)comppad);
5114
5115     CvPADLIST(compcv) = comppadlist;
5116     CvOUTSIDE(compcv) = (CV*)SvREFCNT_inc((SV*)outsidecv);
5117
5118     return oldsavestack_ix;
5119 }
5120
5121 int
5122 yywarn(s)
5123 char *s;
5124 {
5125     --error_count;
5126     in_eval |= 2;
5127     yyerror(s);
5128     in_eval &= ~2;
5129     return 0;
5130 }
5131
5132 int
5133 yyerror(s)
5134 char *s;
5135 {
5136     char tmpbuf[258];
5137     char *tname = tmpbuf;
5138
5139     if (bufptr > oldoldbufptr && bufptr - oldoldbufptr < 200 &&
5140       oldoldbufptr != oldbufptr && oldbufptr != bufptr) {
5141         while (isSPACE(*oldoldbufptr))
5142             oldoldbufptr++;
5143         sprintf(tname,"near \"%.*s\"",bufptr - oldoldbufptr, oldoldbufptr);
5144     }
5145     else if (bufptr > oldbufptr && bufptr - oldbufptr < 200 &&
5146       oldbufptr != bufptr) {
5147         while (isSPACE(*oldbufptr))
5148             oldbufptr++;
5149         sprintf(tname,"near \"%.*s\"",bufptr - oldbufptr, oldbufptr);
5150     }
5151     else if (yychar > 255)
5152         tname = "next token ???";
5153     else if (!yychar || (yychar == ';' && !rsfp))
5154         (void)strcpy(tname,"at EOF");
5155     else if ((yychar & 127) == 127) {
5156         if (lex_state == LEX_NORMAL ||
5157            (lex_state == LEX_KNOWNEXT && lex_defer == LEX_NORMAL))
5158             (void)strcpy(tname,"at end of line");
5159         else if (lex_inpat)
5160             (void)strcpy(tname,"within pattern");
5161         else
5162             (void)strcpy(tname,"within string");
5163     }
5164     else if (yychar < 32)
5165         (void)sprintf(tname,"next char ^%c",toCTRL(yychar));
5166     else
5167         (void)sprintf(tname,"next char %c",yychar);
5168     (void)sprintf(buf, "%s at %s line %d, %s\n",
5169       s,SvPVX(GvSV(curcop->cop_filegv)),curcop->cop_line,tname);
5170     if (multi_start < multi_end && (U32)(curcop->cop_line - multi_end) <= 1) {
5171         sprintf(buf+strlen(buf),
5172         "  (Might be a runaway multi-line %c%c string starting on line %ld)\n",
5173                 multi_open,multi_close,(long)multi_start);
5174         multi_end = 0;
5175     }
5176     if (in_eval & 2)
5177         warn("%s",buf);
5178     else if (in_eval)
5179         sv_catpv(GvSV(errgv),buf);
5180     else
5181         PerlIO_printf(PerlIO_stderr(), "%s",buf);
5182     if (++error_count >= 10)
5183         croak("%s has too many errors.\n",
5184         SvPVX(GvSV(curcop->cop_filegv)));
5185     in_my = 0;
5186     return 0;
5187 }