Move lib/B/... and lib/[BO].pm over to where they should be,
[p5sagit/p5-mst-13.2.git] / toke.c
1 /*    toke.c
2  *
3  *    Copyright (c) 1991-1997, Larry Wall
4  *
5  *    You may distribute under the terms of either the GNU General Public
6  *    License or the Artistic License, as specified in the README file.
7  *
8  */
9
10 /*
11  *   "It all comes from here, the stench and the peril."  --Frodo
12  */
13
14 #include "EXTERN.h"
15 #include "perl.h"
16
17 static void check_uni _((void));
18 static void  force_next _((I32 type));
19 static char *force_version _((char *start));
20 static char *force_word _((char *start, int token, int check_keyword, int allow_pack, int allow_tick));
21 static SV *q _((SV *sv));
22 static char *scan_const _((char *start));
23 static char *scan_formline _((char *s));
24 static char *scan_heredoc _((char *s));
25 static char *scan_ident _((char *s, char *send, char *dest, STRLEN destlen,
26                            I32 ck_uni));
27 static char *scan_inputsymbol _((char *start));
28 static char *scan_pat _((char *start));
29 static char *scan_str _((char *start));
30 static char *scan_subst _((char *start));
31 static char *scan_trans _((char *start));
32 static char *scan_word _((char *s, char *dest, STRLEN destlen,
33                           int allow_package, STRLEN *slp));
34 static char *skipspace _((char *s));
35 static void checkcomma _((char *s, char *name, char *what));
36 static void force_ident _((char *s, int kind));
37 static void incline _((char *s));
38 static int intuit_method _((char *s, GV *gv));
39 static int intuit_more _((char *s));
40 static I32 lop _((I32 f, expectation x, char *s));
41 static void missingterm _((char *s));
42 static void no_op _((char *what, char *s));
43 static void set_csh _((void));
44 static I32 sublex_done _((void));
45 static I32 sublex_push _((void));
46 static I32 sublex_start _((void));
47 #ifdef CRIPPLED_CC
48 static int uni _((I32 f, char *s));
49 #endif
50 static char * filter_gets _((SV *sv, PerlIO *fp, STRLEN append));
51 static void restore_rsfp _((void *f));
52 static void restore_expect _((void *e));
53 static void restore_lex_expect _((void *e));
54
55 static char ident_too_long[] = "Identifier too long";
56
57 static char *linestart;         /* beg. of most recently read line */
58
59 static char pending_ident;      /* pending identifier lookup */
60
61 static struct {
62     I32 super_state;    /* lexer state to save */
63     I32 sub_inwhat;     /* "lex_inwhat" to use */
64     OP *sub_op;         /* "lex_op" to use */
65 } sublex_info;
66
67 /* The following are arranged oddly so that the guard on the switch statement
68  * can get by with a single comparison (if the compiler is smart enough).
69  */
70
71 /* #define LEX_NOTPARSING               11 is done in perl.h. */
72
73 #define LEX_NORMAL              10
74 #define LEX_INTERPNORMAL         9
75 #define LEX_INTERPCASEMOD        8
76 #define LEX_INTERPPUSH           7
77 #define LEX_INTERPSTART          6
78 #define LEX_INTERPEND            5
79 #define LEX_INTERPENDMAYBE       4
80 #define LEX_INTERPCONCAT         3
81 #define LEX_INTERPCONST          2
82 #define LEX_FORMLINE             1
83 #define LEX_KNOWNEXT             0
84
85 #ifdef I_FCNTL
86 #include <fcntl.h>
87 #endif
88 #ifdef I_SYS_FILE
89 #include <sys/file.h>
90 #endif
91
92 /* XXX If this causes problems, set i_unistd=undef in the hint file.  */
93 #ifdef I_UNISTD
94 #  include <unistd.h> /* Needed for execv() */
95 #endif
96
97
98 #ifdef ff_next
99 #undef ff_next
100 #endif
101
102 #include "keywords.h"
103
104 #ifdef CLINE
105 #undef CLINE
106 #endif
107 #define CLINE (copline = (curcop->cop_line < copline ? curcop->cop_line : copline))
108
109 #define TOKEN(retval) return (bufptr = s,(int)retval)
110 #define OPERATOR(retval) return (expect = XTERM,bufptr = s,(int)retval)
111 #define AOPERATOR(retval) return ao((expect = XTERM,bufptr = s,(int)retval))
112 #define PREBLOCK(retval) return (expect = XBLOCK,bufptr = s,(int)retval)
113 #define PRETERMBLOCK(retval) return (expect = XTERMBLOCK,bufptr = s,(int)retval)
114 #define PREREF(retval) return (expect = XREF,bufptr = s,(int)retval)
115 #define TERM(retval) return (CLINE, expect = XOPERATOR,bufptr = s,(int)retval)
116 #define LOOPX(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)LOOPEX)
117 #define FTST(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)UNIOP)
118 #define FUN0(f) return(yylval.ival = f,expect = XOPERATOR,bufptr = s,(int)FUNC0)
119 #define FUN1(f) return(yylval.ival = f,expect = XOPERATOR,bufptr = s,(int)FUNC1)
120 #define BOop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)BITOROP))
121 #define BAop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)BITANDOP))
122 #define SHop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)SHIFTOP))
123 #define PWop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)POWOP))
124 #define PMop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)MATCHOP)
125 #define Aop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)ADDOP))
126 #define Mop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)MULOP))
127 #define Eop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)EQOP)
128 #define Rop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)RELOP)
129
130 /* This bit of chicanery makes a unary function followed by
131  * a parenthesis into a function with one argument, highest precedence.
132  */
133 #define UNI(f) return(yylval.ival = f, \
134         expect = XTERM, \
135         bufptr = s, \
136         last_uni = oldbufptr, \
137         last_lop_op = f, \
138         (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
139
140 #define UNIBRACK(f) return(yylval.ival = f, \
141         bufptr = s, \
142         last_uni = oldbufptr, \
143         (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
144
145 /* grandfather return to old style */
146 #define OLDLOP(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)LSTOP)
147
148 static int
149 ao(int toketype)
150 {
151     if (*bufptr == '=') {
152         bufptr++;
153         if (toketype == ANDAND)
154             yylval.ival = OP_ANDASSIGN;
155         else if (toketype == OROR)
156             yylval.ival = OP_ORASSIGN;
157         toketype = ASSIGNOP;
158     }
159     return toketype;
160 }
161
162 static void
163 no_op(char *what, char *s)
164 {
165     char *oldbp = bufptr;
166     bool is_first = (oldbufptr == linestart);
167
168     bufptr = s;
169     yywarn(form("%s found where operator expected", what));
170     if (is_first)
171         warn("\t(Missing semicolon on previous line?)\n");
172     else if (oldoldbufptr && isIDFIRST(*oldoldbufptr)) {
173         char *t;
174         for (t = oldoldbufptr; *t && (isALNUM(*t) || *t == ':'); t++) ;
175         if (t < bufptr && isSPACE(*t))
176             warn("\t(Do you need to predeclare %.*s?)\n",
177                 t - oldoldbufptr, oldoldbufptr);
178
179     }
180     else
181         warn("\t(Missing operator before %.*s?)\n", s - oldbp, oldbp);
182     bufptr = oldbp;
183 }
184
185 static void
186 missingterm(char *s)
187 {
188     char tmpbuf[3];
189     char q;
190     if (s) {
191         char *nl = strrchr(s,'\n');
192         if (nl) 
193             *nl = '\0';
194     }
195     else if (multi_close < 32 || multi_close == 127) {
196         *tmpbuf = '^';
197         tmpbuf[1] = toCTRL(multi_close);
198         s = "\\n";
199         tmpbuf[2] = '\0';
200         s = tmpbuf;
201     }
202     else {
203         *tmpbuf = multi_close;
204         tmpbuf[1] = '\0';
205         s = tmpbuf;
206     }
207     q = strchr(s,'"') ? '\'' : '"';
208     croak("Can't find string terminator %c%s%c anywhere before EOF",q,s,q);
209 }
210
211 void
212 deprecate(char *s)
213 {
214     if (dowarn)
215         warn("Use of %s is deprecated", s);
216 }
217
218 static void
219 depcom(void)
220 {
221     deprecate("comma-less variable list");
222 }
223
224 #ifdef WIN32
225
226 static I32
227 win32_textfilter(int idx, SV *sv, int maxlen)
228 {
229  I32 count = FILTER_READ(idx+1, sv, maxlen);
230  if (count > 0 && !maxlen)
231   win32_strip_return(sv);
232  return count;
233 }
234 #endif
235
236
237 void
238 lex_start(SV *line)
239 {
240     dTHR;
241     char *s;
242     STRLEN len;
243
244     SAVEI32(lex_dojoin);
245     SAVEI32(lex_brackets);
246     SAVEI32(lex_fakebrack);
247     SAVEI32(lex_casemods);
248     SAVEI32(lex_starts);
249     SAVEI32(lex_state);
250     SAVESPTR(lex_inpat);
251     SAVEI32(lex_inwhat);
252     SAVEI16(curcop->cop_line);
253     SAVEPPTR(bufptr);
254     SAVEPPTR(bufend);
255     SAVEPPTR(oldbufptr);
256     SAVEPPTR(oldoldbufptr);
257     SAVEPPTR(linestart);
258     SAVESPTR(linestr);
259     SAVEPPTR(lex_brackstack);
260     SAVEPPTR(lex_casestack);
261     SAVEDESTRUCTOR(restore_rsfp, rsfp);
262     SAVESPTR(lex_stuff);
263     SAVEI32(lex_defer);
264     SAVESPTR(lex_repl);
265     SAVEDESTRUCTOR(restore_expect, tokenbuf + expect); /* encode as pointer */
266     SAVEDESTRUCTOR(restore_lex_expect, tokenbuf + expect);
267
268     lex_state = LEX_NORMAL;
269     lex_defer = 0;
270     expect = XSTATE;
271     lex_brackets = 0;
272     lex_fakebrack = 0;
273     New(899, lex_brackstack, 120, char);
274     New(899, lex_casestack, 12, char);
275     SAVEFREEPV(lex_brackstack);
276     SAVEFREEPV(lex_casestack);
277     lex_casemods = 0;
278     *lex_casestack = '\0';
279     lex_dojoin = 0;
280     lex_starts = 0;
281     lex_stuff = Nullsv;
282     lex_repl = Nullsv;
283     lex_inpat = 0;
284     lex_inwhat = 0;
285     linestr = line;
286     if (SvREADONLY(linestr))
287         linestr = sv_2mortal(newSVsv(linestr));
288     s = SvPV(linestr, len);
289     if (len && s[len-1] != ';') {
290         if (!(SvFLAGS(linestr) & SVs_TEMP))
291             linestr = sv_2mortal(newSVsv(linestr));
292         sv_catpvn(linestr, "\n;", 2);
293     }
294     SvTEMP_off(linestr);
295     oldoldbufptr = oldbufptr = bufptr = linestart = SvPVX(linestr);
296     bufend = bufptr + SvCUR(linestr);
297     SvREFCNT_dec(rs);
298     rs = newSVpv("\n", 1);
299     rsfp = 0;
300 }
301
302 void
303 lex_end(void)
304 {
305     doextract = FALSE;
306 }
307
308 static void
309 restore_rsfp(void *f)
310 {
311     PerlIO *fp = (PerlIO*)f;
312
313     if (rsfp == PerlIO_stdin())
314         PerlIO_clearerr(rsfp);
315     else if (rsfp && (rsfp != fp))
316         PerlIO_close(rsfp);
317     rsfp = fp;
318 }
319
320 static void
321 restore_expect(e)
322 void *e;
323 {
324     /* a safe way to store a small integer in a pointer */
325     expect = (expectation)((char *)e - tokenbuf);
326 }
327
328 static void
329 restore_lex_expect(e)
330 void *e;
331 {
332     /* a safe way to store a small integer in a pointer */
333     lex_expect = (expectation)((char *)e - tokenbuf);
334 }
335
336 static void
337 incline(char *s)
338 {
339     dTHR;
340     char *t;
341     char *n;
342     char ch;
343     int sawline = 0;
344
345     curcop->cop_line++;
346     if (*s++ != '#')
347         return;
348     while (*s == ' ' || *s == '\t') s++;
349     if (strnEQ(s, "line ", 5)) {
350         s += 5;
351         sawline = 1;
352     }
353     if (!isDIGIT(*s))
354         return;
355     n = s;
356     while (isDIGIT(*s))
357         s++;
358     while (*s == ' ' || *s == '\t')
359         s++;
360     if (*s == '"' && (t = strchr(s+1, '"')))
361         s++;
362     else {
363         if (!sawline)
364             return;             /* false alarm */
365         for (t = s; !isSPACE(*t); t++) ;
366     }
367     ch = *t;
368     *t = '\0';
369     if (t - s > 0)
370         curcop->cop_filegv = gv_fetchfile(s);
371     else
372         curcop->cop_filegv = gv_fetchfile(origfilename);
373     *t = ch;
374     curcop->cop_line = atoi(n)-1;
375 }
376
377 static char *
378 skipspace(register char *s)
379 {
380     dTHR;
381     if (lex_formbrack && lex_brackets <= lex_formbrack) {
382         while (s < bufend && (*s == ' ' || *s == '\t'))
383             s++;
384         return s;
385     }
386     for (;;) {
387         STRLEN prevlen;
388         while (s < bufend && isSPACE(*s))
389             s++;
390         if (s < bufend && *s == '#') {
391             while (s < bufend && *s != '\n')
392                 s++;
393             if (s < bufend)
394                 s++;
395         }
396         if (s < bufend || !rsfp || lex_state != LEX_NORMAL)
397             return s;
398         if ((s = filter_gets(linestr, rsfp, (prevlen = SvCUR(linestr)))) == Nullch) {
399             if (minus_n || minus_p) {
400                 sv_setpv(linestr,minus_p ?
401                          ";}continue{print or die qq(-p destination: $!\\n)" :
402                          "");
403                 sv_catpv(linestr,";}");
404                 minus_n = minus_p = 0;
405             }
406             else
407                 sv_setpv(linestr,";");
408             oldoldbufptr = oldbufptr = bufptr = s = linestart = SvPVX(linestr);
409             bufend = SvPVX(linestr) + SvCUR(linestr);
410             if (preprocess && !in_eval)
411                 (void)PerlProc_pclose(rsfp);
412             else if ((PerlIO*)rsfp == PerlIO_stdin())
413                 PerlIO_clearerr(rsfp);
414             else
415                 (void)PerlIO_close(rsfp);
416             if (e_fp == rsfp)
417                 e_fp = Nullfp;
418             rsfp = Nullfp;
419             return s;
420         }
421         linestart = bufptr = s + prevlen;
422         bufend = s + SvCUR(linestr);
423         s = bufptr;
424         incline(s);
425         if (PERLDB_LINE && curstash != debstash) {
426             SV *sv = NEWSV(85,0);
427
428             sv_upgrade(sv, SVt_PVMG);
429             sv_setpvn(sv,bufptr,bufend-bufptr);
430             av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
431         }
432     }
433 }
434
435 static void
436 check_uni(void) {
437     char *s;
438     char ch;
439     char *t;
440
441     if (oldoldbufptr != last_uni)
442         return;
443     while (isSPACE(*last_uni))
444         last_uni++;
445     for (s = last_uni; isALNUM(*s) || *s == '-'; s++) ;
446     if ((t = strchr(s, '(')) && t < bufptr)
447         return;
448     ch = *s;
449     *s = '\0';
450     warn("Warning: Use of \"%s\" without parens is ambiguous", last_uni);
451     *s = ch;
452 }
453
454 #ifdef CRIPPLED_CC
455
456 #undef UNI
457 #define UNI(f) return uni(f,s)
458
459 static int
460 uni(I32 f, char *s)
461 {
462     yylval.ival = f;
463     expect = XTERM;
464     bufptr = s;
465     last_uni = oldbufptr;
466     last_lop_op = f;
467     if (*s == '(')
468         return FUNC1;
469     s = skipspace(s);
470     if (*s == '(')
471         return FUNC1;
472     else
473         return UNIOP;
474 }
475
476 #endif /* CRIPPLED_CC */
477
478 #define LOP(f,x) return lop(f,x,s)
479
480 static I32
481 lop
482 #ifdef CAN_PROTOTYPE
483    (I32 f, expectation x, char *s)
484 #else
485    (f,x,s)
486 I32 f;
487 expectation x;
488 char *s;
489 #endif /* CAN_PROTOTYPE */
490 {
491     dTHR;
492     yylval.ival = f;
493     CLINE;
494     expect = x;
495     bufptr = s;
496     last_lop = oldbufptr;
497     last_lop_op = f;
498     if (nexttoke)
499         return LSTOP;
500     if (*s == '(')
501         return FUNC;
502     s = skipspace(s);
503     if (*s == '(')
504         return FUNC;
505     else
506         return LSTOP;
507 }
508
509 static void 
510 force_next(I32 type)
511 {
512     nexttype[nexttoke] = type;
513     nexttoke++;
514     if (lex_state != LEX_KNOWNEXT) {
515         lex_defer = lex_state;
516         lex_expect = expect;
517         lex_state = LEX_KNOWNEXT;
518     }
519 }
520
521 static char *
522 force_word(register char *start, int token, int check_keyword, int allow_pack, int allow_initial_tick)
523 {
524     register char *s;
525     STRLEN len;
526     
527     start = skipspace(start);
528     s = start;
529     if (isIDFIRST(*s) ||
530         (allow_pack && *s == ':') ||
531         (allow_initial_tick && *s == '\'') )
532     {
533         s = scan_word(s, tokenbuf, sizeof tokenbuf, allow_pack, &len);
534         if (check_keyword && keyword(tokenbuf, len))
535             return start;
536         if (token == METHOD) {
537             s = skipspace(s);
538             if (*s == '(')
539                 expect = XTERM;
540             else {
541                 expect = XOPERATOR;
542                 force_next(')');
543                 force_next('(');
544             }
545         }
546         nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST,0, newSVpv(tokenbuf,0));
547         nextval[nexttoke].opval->op_private |= OPpCONST_BARE;
548         force_next(token);
549     }
550     return s;
551 }
552
553 static void
554 force_ident(register char *s, int kind)
555 {
556     if (s && *s) {
557         OP* o = (OP*)newSVOP(OP_CONST, 0, newSVpv(s,0));
558         nextval[nexttoke].opval = o;
559         force_next(WORD);
560         if (kind) {
561             dTHR;               /* just for in_eval */
562             o->op_private = OPpCONST_ENTERED;
563             /* XXX see note in pp_entereval() for why we forgo typo
564                warnings if the symbol must be introduced in an eval.
565                GSAR 96-10-12 */
566             gv_fetchpv(s, in_eval ? GV_ADDMULTI : TRUE,
567                 kind == '$' ? SVt_PV :
568                 kind == '@' ? SVt_PVAV :
569                 kind == '%' ? SVt_PVHV :
570                               SVt_PVGV
571                 );
572         }
573     }
574 }
575
576 static char *
577 force_version(char *s)
578 {
579     OP *version = Nullop;
580
581     s = skipspace(s);
582
583     /* default VERSION number -- GBARR */
584
585     if(isDIGIT(*s)) {
586         char *d;
587         int c;
588         for( d=s, c = 1; isDIGIT(*d) || *d == '_' || (*d == '.' && c--); d++);
589         if((*d == ';' || isSPACE(*d)) && *(skipspace(d)) != ',') {
590             s = scan_num(s);
591             /* real VERSION number -- GBARR */
592             version = yylval.opval;
593         }
594     }
595
596     /* NOTE: The parser sees the package name and the VERSION swapped */
597     nextval[nexttoke].opval = version;
598     force_next(WORD); 
599
600     return (s);
601 }
602
603 static SV *
604 q(SV *sv)
605 {
606     register char *s;
607     register char *send;
608     register char *d;
609     STRLEN len;
610
611     if (!SvLEN(sv))
612         return sv;
613
614     s = SvPV_force(sv, len);
615     if (SvIVX(sv) == -1)
616         return sv;
617     send = s + len;
618     while (s < send && *s != '\\')
619         s++;
620     if (s == send)
621         return sv;
622     d = s;
623     while (s < send) {
624         if (*s == '\\') {
625             if (s + 1 < send && (s[1] == '\\'))
626                 s++;            /* all that, just for this */
627         }
628         *d++ = *s++;
629     }
630     *d = '\0';
631     SvCUR_set(sv, d - SvPVX(sv));
632
633     return sv;
634 }
635
636 static I32
637 sublex_start(void)
638 {
639     register I32 op_type = yylval.ival;
640
641     if (op_type == OP_NULL) {
642         yylval.opval = lex_op;
643         lex_op = Nullop;
644         return THING;
645     }
646     if (op_type == OP_CONST || op_type == OP_READLINE) {
647         SV *sv = q(lex_stuff);
648         STRLEN len;
649         char *p = SvPV(sv, len);
650         yylval.opval = (OP*)newSVOP(op_type, 0, newSVpv(p, len));
651         SvREFCNT_dec(sv);
652         lex_stuff = Nullsv;
653         return THING;
654     }
655
656     sublex_info.super_state = lex_state;
657     sublex_info.sub_inwhat = op_type;
658     sublex_info.sub_op = lex_op;
659     lex_state = LEX_INTERPPUSH;
660
661     expect = XTERM;
662     if (lex_op) {
663         yylval.opval = lex_op;
664         lex_op = Nullop;
665         return PMFUNC;
666     }
667     else
668         return FUNC;
669 }
670
671 static I32
672 sublex_push(void)
673 {
674     dTHR;
675     ENTER;
676
677     lex_state = sublex_info.super_state;
678     SAVEI32(lex_dojoin);
679     SAVEI32(lex_brackets);
680     SAVEI32(lex_fakebrack);
681     SAVEI32(lex_casemods);
682     SAVEI32(lex_starts);
683     SAVEI32(lex_state);
684     SAVESPTR(lex_inpat);
685     SAVEI32(lex_inwhat);
686     SAVEI16(curcop->cop_line);
687     SAVEPPTR(bufptr);
688     SAVEPPTR(oldbufptr);
689     SAVEPPTR(oldoldbufptr);
690     SAVEPPTR(linestart);
691     SAVESPTR(linestr);
692     SAVEPPTR(lex_brackstack);
693     SAVEPPTR(lex_casestack);
694
695     linestr = lex_stuff;
696     lex_stuff = Nullsv;
697
698     bufend = bufptr = oldbufptr = oldoldbufptr = linestart = SvPVX(linestr);
699     bufend += SvCUR(linestr);
700     SAVEFREESV(linestr);
701
702     lex_dojoin = FALSE;
703     lex_brackets = 0;
704     lex_fakebrack = 0;
705     New(899, lex_brackstack, 120, char);
706     New(899, lex_casestack, 12, char);
707     SAVEFREEPV(lex_brackstack);
708     SAVEFREEPV(lex_casestack);
709     lex_casemods = 0;
710     *lex_casestack = '\0';
711     lex_starts = 0;
712     lex_state = LEX_INTERPCONCAT;
713     curcop->cop_line = multi_start;
714
715     lex_inwhat = sublex_info.sub_inwhat;
716     if (lex_inwhat == OP_MATCH || lex_inwhat == OP_SUBST)
717         lex_inpat = sublex_info.sub_op;
718     else
719         lex_inpat = Nullop;
720
721     return '(';
722 }
723
724 static I32
725 sublex_done(void)
726 {
727     if (!lex_starts++) {
728         expect = XOPERATOR;
729         yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv("",0));
730         return THING;
731     }
732
733     if (lex_casemods) {         /* oops, we've got some unbalanced parens */
734         lex_state = LEX_INTERPCASEMOD;
735         return yylex();
736     }
737
738     /* Is there a right-hand side to take care of? */
739     if (lex_repl && (lex_inwhat == OP_SUBST || lex_inwhat == OP_TRANS)) {
740         linestr = lex_repl;
741         lex_inpat = 0;
742         bufend = bufptr = oldbufptr = oldoldbufptr = linestart = SvPVX(linestr);
743         bufend += SvCUR(linestr);
744         SAVEFREESV(linestr);
745         lex_dojoin = FALSE;
746         lex_brackets = 0;
747         lex_fakebrack = 0;
748         lex_casemods = 0;
749         *lex_casestack = '\0';
750         lex_starts = 0;
751         if (SvCOMPILED(lex_repl)) {
752             lex_state = LEX_INTERPNORMAL;
753             lex_starts++;
754         }
755         else
756             lex_state = LEX_INTERPCONCAT;
757         lex_repl = Nullsv;
758         return ',';
759     }
760     else {
761         LEAVE;
762         bufend = SvPVX(linestr);
763         bufend += SvCUR(linestr);
764         expect = XOPERATOR;
765         return ')';
766     }
767 }
768
769 static char *
770 scan_const(char *start)
771 {
772     register char *send = bufend;
773     SV *sv = NEWSV(93, send - start);
774     register char *s = start;
775     register char *d = SvPVX(sv);
776     bool dorange = FALSE;
777     I32 len;
778     char *leaveit =
779         lex_inpat
780             ? "\\.^$@AGZdDwWsSbB+*?|()-nrtfeaxc0123456789[{]} \t\n\r\f\v#"
781             : (lex_inwhat & OP_TRANS)
782                 ? ""
783                 : "";
784
785     while (s < send || dorange) {
786         if (lex_inwhat == OP_TRANS) {
787             if (dorange) {
788                 I32 i;
789                 I32 max;
790                 i = d - SvPVX(sv);
791                 SvGROW(sv, SvLEN(sv) + 256);
792                 d = SvPVX(sv) + i;
793                 d -= 2;
794                 max = (U8)d[1];
795                 for (i = (U8)*d; i <= max; i++)
796                     *d++ = i;
797                 dorange = FALSE;
798                 continue;
799             }
800             else if (*s == '-' && s+1 < send  && s != start) {
801                 dorange = TRUE;
802                 s++;
803             }
804         }
805         else if (*s == '(' && lex_inpat && s[1] == '?') {
806             if (s[2] == '#') {
807                 while (s < send && *s != ')')
808                     *d++ = *s++;
809             } else if (s[2] == '{') {   /* This should march regcomp.c */
810                 I32 count = 1;
811                 char *regparse = s + 3;
812                 char c;
813
814                 while (count && (c = *regparse)) {
815                     if (c == '\\' && regparse[1])
816                         regparse++;
817                     else if (c == '{') 
818                         count++;
819                     else if (c == '}') 
820                         count--;
821                     regparse++;
822                 }
823                 if (*regparse == ')')
824                     regparse++;
825                 else
826                     yyerror("Sequence (?{...}) not terminated or not {}-balanced");
827                 while (s < regparse && *s != ')')
828                     *d++ = *s++;
829             }
830         }
831         else if (*s == '#' && lex_inpat &&
832           ((PMOP*)lex_inpat)->op_pmflags & PMf_EXTENDED) {
833             while (s+1 < send && *s != '\n')
834                 *d++ = *s++;
835         }
836         else if (*s == '@' && s[1] && (isALNUM(s[1]) || strchr(":'{$", s[1])))
837             break;
838         else if (*s == '$') {
839             if (!lex_inpat)     /* not a regexp, so $ must be var */
840                 break;
841             if (s + 1 < send && !strchr("()| \n\t", s[1]))
842                 break;          /* in regexp, $ might be tail anchor */
843         }
844         if (*s == '\\' && s+1 < send) {
845             s++;
846             if (*s && strchr(leaveit, *s)) {
847                 *d++ = '\\';
848                 *d++ = *s++;
849                 continue;
850             }
851             if (lex_inwhat == OP_SUBST && !lex_inpat &&
852                 isDIGIT(*s) && *s != '0' && !isDIGIT(s[1]))
853             {
854                 if (dowarn)
855                     warn("\\%c better written as $%c", *s, *s);
856                 *--s = '$';
857                 break;
858             }
859             if (lex_inwhat != OP_TRANS && *s && strchr("lLuUEQ", *s)) {
860                 --s;
861                 break;
862             }
863             switch (*s) {
864             case '-':
865                 if (lex_inwhat == OP_TRANS) {
866                     *d++ = *s++;
867                     continue;
868                 }
869                 /* FALL THROUGH */
870             default:
871                 *d++ = *s++;
872                 continue;
873             case '0': case '1': case '2': case '3':
874             case '4': case '5': case '6': case '7':
875                 *d++ = scan_oct(s, 3, &len);
876                 s += len;
877                 continue;
878             case 'x':
879                 *d++ = scan_hex(++s, 2, &len);
880                 s += len;
881                 continue;
882             case 'c':
883                 s++;
884                 len = *s++;
885                 *d++ = toCTRL(len);
886                 continue;
887             case 'b':
888                 *d++ = '\b';
889                 break;
890             case 'n':
891                 *d++ = '\n';
892                 break;
893             case 'r':
894                 *d++ = '\r';
895                 break;
896             case 'f':
897                 *d++ = '\f';
898                 break;
899             case 't':
900                 *d++ = '\t';
901                 break;
902             case 'e':
903                 *d++ = '\033';
904                 break;
905             case 'a':
906                 *d++ = '\007';
907                 break;
908             }
909             s++;
910             continue;
911         }
912         *d++ = *s++;
913     }
914     *d = '\0';
915     SvCUR_set(sv, d - SvPVX(sv));
916     SvPOK_on(sv);
917
918     if (SvCUR(sv) + 5 < SvLEN(sv)) {
919         SvLEN_set(sv, SvCUR(sv) + 1);
920         Renew(SvPVX(sv), SvLEN(sv), char);
921     }
922     if (s > bufptr)
923         yylval.opval = (OP*)newSVOP(OP_CONST, 0, sv);
924     else
925         SvREFCNT_dec(sv);
926     return s;
927 }
928
929 /* This is the one truly awful dwimmer necessary to conflate C and sed. */
930 static int
931 intuit_more(register char *s)
932 {
933     if (lex_brackets)
934         return TRUE;
935     if (*s == '-' && s[1] == '>' && (s[2] == '[' || s[2] == '{'))
936         return TRUE;
937     if (*s != '{' && *s != '[')
938         return FALSE;
939     if (!lex_inpat)
940         return TRUE;
941
942     /* In a pattern, so maybe we have {n,m}. */
943     if (*s == '{') {
944         s++;
945         if (!isDIGIT(*s))
946             return TRUE;
947         while (isDIGIT(*s))
948             s++;
949         if (*s == ',')
950             s++;
951         while (isDIGIT(*s))
952             s++;
953         if (*s == '}')
954             return FALSE;
955         return TRUE;
956         
957     }
958
959     /* On the other hand, maybe we have a character class */
960
961     s++;
962     if (*s == ']' || *s == '^')
963         return FALSE;
964     else {
965         int weight = 2;         /* let's weigh the evidence */
966         char seen[256];
967         unsigned char un_char = 0, last_un_char;
968         char *send = strchr(s,']');
969         char tmpbuf[sizeof tokenbuf * 4];
970
971         if (!send)              /* has to be an expression */
972             return TRUE;
973
974         Zero(seen,256,char);
975         if (*s == '$')
976             weight -= 3;
977         else if (isDIGIT(*s)) {
978             if (s[1] != ']') {
979                 if (isDIGIT(s[1]) && s[2] == ']')
980                     weight -= 10;
981             }
982             else
983                 weight -= 100;
984         }
985         for (; s < send; s++) {
986             last_un_char = un_char;
987             un_char = (unsigned char)*s;
988             switch (*s) {
989             case '@':
990             case '&':
991             case '$':
992                 weight -= seen[un_char] * 10;
993                 if (isALNUM(s[1])) {
994                     scan_ident(s, send, tmpbuf, sizeof tmpbuf, FALSE);
995                     if ((int)strlen(tmpbuf) > 1 && gv_fetchpv(tmpbuf,FALSE, SVt_PV))
996                         weight -= 100;
997                     else
998                         weight -= 10;
999                 }
1000                 else if (*s == '$' && s[1] &&
1001                   strchr("[#!%*<>()-=",s[1])) {
1002                     if (/*{*/ strchr("])} =",s[2]))
1003                         weight -= 10;
1004                     else
1005                         weight -= 1;
1006                 }
1007                 break;
1008             case '\\':
1009                 un_char = 254;
1010                 if (s[1]) {
1011                     if (strchr("wds]",s[1]))
1012                         weight += 100;
1013                     else if (seen['\''] || seen['"'])
1014                         weight += 1;
1015                     else if (strchr("rnftbxcav",s[1]))
1016                         weight += 40;
1017                     else if (isDIGIT(s[1])) {
1018                         weight += 40;
1019                         while (s[1] && isDIGIT(s[1]))
1020                             s++;
1021                     }
1022                 }
1023                 else
1024                     weight += 100;
1025                 break;
1026             case '-':
1027                 if (s[1] == '\\')
1028                     weight += 50;
1029                 if (strchr("aA01! ",last_un_char))
1030                     weight += 30;
1031                 if (strchr("zZ79~",s[1]))
1032                     weight += 30;
1033                 break;
1034             default:
1035                 if (!isALNUM(last_un_char) && !strchr("$@&",last_un_char) &&
1036                         isALPHA(*s) && s[1] && isALPHA(s[1])) {
1037                     char *d = tmpbuf;
1038                     while (isALPHA(*s))
1039                         *d++ = *s++;
1040                     *d = '\0';
1041                     if (keyword(tmpbuf, d - tmpbuf))
1042                         weight -= 150;
1043                 }
1044                 if (un_char == last_un_char + 1)
1045                     weight += 5;
1046                 weight -= seen[un_char];
1047                 break;
1048             }
1049             seen[un_char]++;
1050         }
1051         if (weight >= 0)        /* probably a character class */
1052             return FALSE;
1053     }
1054
1055     return TRUE;
1056 }
1057
1058 static int
1059 intuit_method(char *start, GV *gv)
1060 {
1061     char *s = start + (*start == '$');
1062     char tmpbuf[sizeof tokenbuf];
1063     STRLEN len;
1064     GV* indirgv;
1065
1066     if (gv) {
1067         CV *cv;
1068         if (GvIO(gv))
1069             return 0;
1070         if ((cv = GvCVu(gv))) {
1071             char *proto = SvPVX(cv);
1072             if (proto) {
1073                 if (*proto == ';')
1074                     proto++;
1075                 if (*proto == '*')
1076                     return 0;
1077             }
1078         } else
1079             gv = 0;
1080     }
1081     s = scan_word(s, tmpbuf, sizeof tmpbuf, TRUE, &len);
1082     if (*start == '$') {
1083         if (gv || last_lop_op == OP_PRINT || isUPPER(*tokenbuf))
1084             return 0;
1085         s = skipspace(s);
1086         bufptr = start;
1087         expect = XREF;
1088         return *s == '(' ? FUNCMETH : METHOD;
1089     }
1090     if (!keyword(tmpbuf, len)) {
1091         indirgv = gv_fetchpv(tmpbuf,FALSE, SVt_PVCV);
1092         if (indirgv && GvCVu(indirgv))
1093             return 0;
1094         /* filehandle or package name makes it a method */
1095         if (!gv || GvIO(indirgv) || gv_stashpvn(tmpbuf, len, FALSE)) {
1096             s = skipspace(s);
1097             if ((bufend - s) >= 2 && *s == '=' && *(s+1) == '>')
1098                 return 0;       /* no assumptions -- "=>" quotes bearword */
1099             nextval[nexttoke].opval =
1100                 (OP*)newSVOP(OP_CONST, 0,
1101                             newSVpv(tmpbuf,0));
1102             nextval[nexttoke].opval->op_private =
1103                 OPpCONST_BARE;
1104             expect = XTERM;
1105             force_next(WORD);
1106             bufptr = s;
1107             return *s == '(' ? FUNCMETH : METHOD;
1108         }
1109     }
1110     return 0;
1111 }
1112
1113 static char*
1114 incl_perldb(void)
1115 {
1116     if (perldb) {
1117         char *pdb = PerlEnv_getenv("PERL5DB");
1118
1119         if (pdb)
1120             return pdb;
1121         SETERRNO(0,SS$_NORMAL);
1122         return "BEGIN { require 'perl5db.pl' }";
1123     }
1124     return "";
1125 }
1126
1127
1128 /* Encoded script support. filter_add() effectively inserts a
1129  * 'pre-processing' function into the current source input stream. 
1130  * Note that the filter function only applies to the current source file
1131  * (e.g., it will not affect files 'require'd or 'use'd by this one).
1132  *
1133  * The datasv parameter (which may be NULL) can be used to pass
1134  * private data to this instance of the filter. The filter function
1135  * can recover the SV using the FILTER_DATA macro and use it to
1136  * store private buffers and state information.
1137  *
1138  * The supplied datasv parameter is upgraded to a PVIO type
1139  * and the IoDIRP field is used to store the function pointer.
1140  * Note that IoTOP_NAME, IoFMT_NAME, IoBOTTOM_NAME, if set for
1141  * private use must be set using malloc'd pointers.
1142  */
1143 static int filter_debug = 0;
1144
1145 SV *
1146 filter_add(filter_t funcp, SV *datasv)
1147 {
1148     if (!funcp){ /* temporary handy debugging hack to be deleted */
1149         filter_debug = atoi((char*)datasv);
1150         return NULL;
1151     }
1152     if (!rsfp_filters)
1153         rsfp_filters = newAV();
1154     if (!datasv)
1155         datasv = NEWSV(255,0);
1156     if (!SvUPGRADE(datasv, SVt_PVIO))
1157         die("Can't upgrade filter_add data to SVt_PVIO");
1158     IoDIRP(datasv) = (DIR*)funcp; /* stash funcp into spare field */
1159     if (filter_debug)
1160         warn("filter_add func %p (%s)", funcp, SvPV(datasv,na));
1161     av_unshift(rsfp_filters, 1);
1162     av_store(rsfp_filters, 0, datasv) ;
1163     return(datasv);
1164 }
1165  
1166
1167 /* Delete most recently added instance of this filter function. */
1168 void
1169 filter_del(filter_t funcp)
1170 {
1171     if (filter_debug)
1172         warn("filter_del func %p", funcp);
1173     if (!rsfp_filters || AvFILLp(rsfp_filters)<0)
1174         return;
1175     /* if filter is on top of stack (usual case) just pop it off */
1176     if (IoDIRP(FILTER_DATA(AvFILLp(rsfp_filters))) == (void*)funcp){
1177         sv_free(av_pop(rsfp_filters));
1178
1179         return;
1180     }
1181     /* we need to search for the correct entry and clear it     */
1182     die("filter_del can only delete in reverse order (currently)");
1183 }
1184
1185
1186 /* Invoke the n'th filter function for the current rsfp.         */
1187 I32
1188 filter_read(int idx, SV *buf_sv, int maxlen)
1189             
1190                
1191                         /* 0 = read one text line */
1192 {
1193     filter_t funcp;
1194     SV *datasv = NULL;
1195
1196     if (!rsfp_filters)
1197         return -1;
1198     if (idx > AvFILLp(rsfp_filters)){       /* Any more filters?        */
1199         /* Provide a default input filter to make life easy.    */
1200         /* Note that we append to the line. This is handy.      */
1201         if (filter_debug)
1202             warn("filter_read %d: from rsfp\n", idx);
1203         if (maxlen) { 
1204             /* Want a block */
1205             int len ;
1206             int old_len = SvCUR(buf_sv) ;
1207
1208             /* ensure buf_sv is large enough */
1209             SvGROW(buf_sv, old_len + maxlen) ;
1210             if ((len = PerlIO_read(rsfp, SvPVX(buf_sv) + old_len, maxlen)) <= 0){
1211                 if (PerlIO_error(rsfp))
1212                     return -1;          /* error */
1213                 else
1214                     return 0 ;          /* end of file */
1215             }
1216             SvCUR_set(buf_sv, old_len + len) ;
1217         } else {
1218             /* Want a line */
1219             if (sv_gets(buf_sv, rsfp, SvCUR(buf_sv)) == NULL) {
1220                 if (PerlIO_error(rsfp))
1221                     return -1;          /* error */
1222                 else
1223                     return 0 ;          /* end of file */
1224             }
1225
1226         }
1227         return SvCUR(buf_sv);
1228     }
1229     /* Skip this filter slot if filter has been deleted */
1230     if ( (datasv = FILTER_DATA(idx)) == &sv_undef){
1231         if (filter_debug)
1232             warn("filter_read %d: skipped (filter deleted)\n", idx);
1233         return FILTER_READ(idx+1, buf_sv, maxlen); /* recurse */
1234     }
1235     /* Get function pointer hidden within datasv        */
1236     funcp = (filter_t)IoDIRP(datasv);
1237     if (filter_debug)
1238         warn("filter_read %d: via function %p (%s)\n",
1239                 idx, funcp, SvPV(datasv,na));
1240     /* Call function. The function is expected to       */
1241     /* call "FILTER_READ(idx+1, buf_sv)" first.         */
1242     /* Return: <0:error, =0:eof, >0:not eof             */
1243     return (*funcp)(idx, buf_sv, maxlen);
1244 }
1245
1246
1247 static char *
1248 filter_gets(register SV *sv, register PerlIO *fp, STRLEN append)
1249 {
1250 #ifdef WIN32FILTER
1251     if (!rsfp_filters) {
1252         filter_add(win32_textfilter,NULL);
1253     }
1254 #endif
1255     if (rsfp_filters) {
1256
1257         if (!append)
1258             SvCUR_set(sv, 0);   /* start with empty line        */
1259         if (FILTER_READ(0, sv, 0) > 0)
1260             return ( SvPVX(sv) ) ;
1261         else
1262             return Nullch ;
1263     }
1264     else 
1265         return (sv_gets(sv, fp, append));
1266 }
1267
1268
1269 #ifdef DEBUGGING
1270     static char* exp_name[] =
1271         { "OPERATOR", "TERM", "REF", "STATE", "BLOCK", "TERMBLOCK" };
1272 #endif
1273
1274 EXT int yychar;         /* last token */
1275
1276 int
1277 yylex(void)
1278 {
1279     dTHR;
1280     register char *s;
1281     register char *d;
1282     register I32 tmp;
1283     STRLEN len;
1284     GV *gv = Nullgv;
1285     GV **gvp = 0;
1286
1287     if (pending_ident) {
1288         char pit = pending_ident;
1289         pending_ident = 0;
1290
1291         if (in_my) {
1292             if (strchr(tokenbuf,':'))
1293                 croak(no_myglob,tokenbuf);
1294             yylval.opval = newOP(OP_PADANY, 0);
1295             yylval.opval->op_targ = pad_allocmy(tokenbuf);
1296             return PRIVATEREF;
1297         }
1298
1299         if (!strchr(tokenbuf,':')) {
1300 #ifdef USE_THREADS
1301             /* Check for single character per-thread SVs */
1302             if (tokenbuf[0] == '$' && tokenbuf[2] == '\0'
1303                 && !isALPHA(tokenbuf[1]) /* Rule out obvious non-threadsvs */
1304                 && (tmp = find_threadsv(&tokenbuf[1])) != NOT_IN_PAD)
1305             {
1306                 yylval.opval = newOP(OP_THREADSV, 0);
1307                 yylval.opval->op_targ = tmp;
1308                 return PRIVATEREF;
1309             }
1310 #endif /* USE_THREADS */
1311             if ((tmp = pad_findmy(tokenbuf)) != NOT_IN_PAD) {
1312                 if (last_lop_op == OP_SORT &&
1313                     tokenbuf[0] == '$' &&
1314                     (tokenbuf[1] == 'a' || tokenbuf[1] == 'b')
1315                     && !tokenbuf[2])
1316                 {
1317                     for (d = in_eval ? oldoldbufptr : linestart;
1318                          d < bufend && *d != '\n';
1319                          d++)
1320                     {
1321                         if (strnEQ(d,"<=>",3) || strnEQ(d,"cmp",3)) {
1322                             croak("Can't use \"my %s\" in sort comparison",
1323                                   tokenbuf);
1324                         }
1325                     }
1326                 }
1327
1328                 yylval.opval = newOP(OP_PADANY, 0);
1329                 yylval.opval->op_targ = tmp;
1330                 return PRIVATEREF;
1331             }
1332         }
1333
1334         /* Force them to make up their mind on "@foo". */
1335         if (pit == '@' && lex_state != LEX_NORMAL && !lex_brackets) {
1336             GV *gv = gv_fetchpv(tokenbuf+1, FALSE, SVt_PVAV);
1337             if (!gv || ((tokenbuf[0] == '@') ? !GvAV(gv) : !GvHV(gv)))
1338                 yyerror(form("In string, %s now must be written as \\%s",
1339                              tokenbuf, tokenbuf));
1340         }
1341
1342         yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf+1, 0));
1343         yylval.opval->op_private = OPpCONST_ENTERED;
1344         gv_fetchpv(tokenbuf+1, in_eval ? GV_ADDMULTI : TRUE,
1345                    ((tokenbuf[0] == '$') ? SVt_PV
1346                     : (tokenbuf[0] == '@') ? SVt_PVAV
1347                     : SVt_PVHV));
1348         return WORD;
1349     }
1350
1351     switch (lex_state) {
1352 #ifdef COMMENTARY
1353     case LEX_NORMAL:            /* Some compilers will produce faster */
1354     case LEX_INTERPNORMAL:      /* code if we comment these out. */
1355         break;
1356 #endif
1357
1358     case LEX_KNOWNEXT:
1359         nexttoke--;
1360         yylval = nextval[nexttoke];
1361         if (!nexttoke) {
1362             lex_state = lex_defer;
1363             expect = lex_expect;
1364             lex_defer = LEX_NORMAL;
1365         }
1366         return(nexttype[nexttoke]);
1367
1368     case LEX_INTERPCASEMOD:
1369 #ifdef DEBUGGING
1370         if (bufptr != bufend && *bufptr != '\\')
1371             croak("panic: INTERPCASEMOD");
1372 #endif
1373         if (bufptr == bufend || bufptr[1] == 'E') {
1374             char oldmod;
1375             if (lex_casemods) {
1376                 oldmod = lex_casestack[--lex_casemods];
1377                 lex_casestack[lex_casemods] = '\0';
1378                 if (bufptr != bufend && strchr("LUQ", oldmod)) {
1379                     bufptr += 2;
1380                     lex_state = LEX_INTERPCONCAT;
1381                 }
1382                 return ')';
1383             }
1384             if (bufptr != bufend)
1385                 bufptr += 2;
1386             lex_state = LEX_INTERPCONCAT;
1387             return yylex();
1388         }
1389         else {
1390             s = bufptr + 1;
1391             if (strnEQ(s, "L\\u", 3) || strnEQ(s, "U\\l", 3))
1392                 tmp = *s, *s = s[2], s[2] = tmp;        /* misordered... */
1393             if (strchr("LU", *s) &&
1394                 (strchr(lex_casestack, 'L') || strchr(lex_casestack, 'U')))
1395             {
1396                 lex_casestack[--lex_casemods] = '\0';
1397                 return ')';
1398             }
1399             if (lex_casemods > 10) {
1400                 char* newlb = Renew(lex_casestack, lex_casemods + 2, char);
1401                 if (newlb != lex_casestack) {
1402                     SAVEFREEPV(newlb);
1403                     lex_casestack = newlb;
1404                 }
1405             }
1406             lex_casestack[lex_casemods++] = *s;
1407             lex_casestack[lex_casemods] = '\0';
1408             lex_state = LEX_INTERPCONCAT;
1409             nextval[nexttoke].ival = 0;
1410             force_next('(');
1411             if (*s == 'l')
1412                 nextval[nexttoke].ival = OP_LCFIRST;
1413             else if (*s == 'u')
1414                 nextval[nexttoke].ival = OP_UCFIRST;
1415             else if (*s == 'L')
1416                 nextval[nexttoke].ival = OP_LC;
1417             else if (*s == 'U')
1418                 nextval[nexttoke].ival = OP_UC;
1419             else if (*s == 'Q')
1420                 nextval[nexttoke].ival = OP_QUOTEMETA;
1421             else
1422                 croak("panic: yylex");
1423             bufptr = s + 1;
1424             force_next(FUNC);
1425             if (lex_starts) {
1426                 s = bufptr;
1427                 lex_starts = 0;
1428                 Aop(OP_CONCAT);
1429             }
1430             else
1431                 return yylex();
1432         }
1433
1434     case LEX_INTERPPUSH:
1435         return sublex_push();
1436
1437     case LEX_INTERPSTART:
1438         if (bufptr == bufend)
1439             return sublex_done();
1440         expect = XTERM;
1441         lex_dojoin = (*bufptr == '@');
1442         lex_state = LEX_INTERPNORMAL;
1443         if (lex_dojoin) {
1444             nextval[nexttoke].ival = 0;
1445             force_next(',');
1446 #ifdef USE_THREADS
1447             nextval[nexttoke].opval = newOP(OP_THREADSV, 0);
1448             nextval[nexttoke].opval->op_targ = find_threadsv("\"");
1449             force_next(PRIVATEREF);
1450 #else
1451             force_ident("\"", '$');
1452 #endif /* USE_THREADS */
1453             nextval[nexttoke].ival = 0;
1454             force_next('$');
1455             nextval[nexttoke].ival = 0;
1456             force_next('(');
1457             nextval[nexttoke].ival = OP_JOIN;   /* emulate join($", ...) */
1458             force_next(FUNC);
1459         }
1460         if (lex_starts++) {
1461             s = bufptr;
1462             Aop(OP_CONCAT);
1463         }
1464         return yylex();
1465
1466     case LEX_INTERPENDMAYBE:
1467         if (intuit_more(bufptr)) {
1468             lex_state = LEX_INTERPNORMAL;       /* false alarm, more expr */
1469             break;
1470         }
1471         /* FALL THROUGH */
1472
1473     case LEX_INTERPEND:
1474         if (lex_dojoin) {
1475             lex_dojoin = FALSE;
1476             lex_state = LEX_INTERPCONCAT;
1477             return ')';
1478         }
1479         /* FALLTHROUGH */
1480     case LEX_INTERPCONCAT:
1481 #ifdef DEBUGGING
1482         if (lex_brackets)
1483             croak("panic: INTERPCONCAT");
1484 #endif
1485         if (bufptr == bufend)
1486             return sublex_done();
1487
1488         if (SvIVX(linestr) == '\'') {
1489             SV *sv = newSVsv(linestr);
1490             if (!lex_inpat)
1491                 sv = q(sv);
1492             yylval.opval = (OP*)newSVOP(OP_CONST, 0, sv);
1493             s = bufend;
1494         }
1495         else {
1496             s = scan_const(bufptr);
1497             if (*s == '\\')
1498                 lex_state = LEX_INTERPCASEMOD;
1499             else
1500                 lex_state = LEX_INTERPSTART;
1501         }
1502
1503         if (s != bufptr) {
1504             nextval[nexttoke] = yylval;
1505             expect = XTERM;
1506             force_next(THING);
1507             if (lex_starts++)
1508                 Aop(OP_CONCAT);
1509             else {
1510                 bufptr = s;
1511                 return yylex();
1512             }
1513         }
1514
1515         return yylex();
1516     case LEX_FORMLINE:
1517         lex_state = LEX_NORMAL;
1518         s = scan_formline(bufptr);
1519         if (!lex_formbrack)
1520             goto rightbracket;
1521         OPERATOR(';');
1522     }
1523
1524     s = bufptr;
1525     oldoldbufptr = oldbufptr;
1526     oldbufptr = s;
1527     DEBUG_p( {
1528         PerlIO_printf(PerlIO_stderr(), "### Tokener expecting %s at %s\n", exp_name[expect], s);
1529     } )
1530
1531   retry:
1532     switch (*s) {
1533     default:
1534         croak("Unrecognized character \\%03o", *s & 255);
1535     case 4:
1536     case 26:
1537         goto fake_eof;                  /* emulate EOF on ^D or ^Z */
1538     case 0:
1539         if (!rsfp) {
1540             last_uni = 0;
1541             last_lop = 0;
1542             if (lex_brackets)
1543                 yyerror("Missing right bracket");
1544             TOKEN(0);
1545         }
1546         if (s++ < bufend)
1547             goto retry;                 /* ignore stray nulls */
1548         last_uni = 0;
1549         last_lop = 0;
1550         if (!in_eval && !preambled) {
1551             preambled = TRUE;
1552             sv_setpv(linestr,incl_perldb());
1553             if (SvCUR(linestr))
1554                 sv_catpv(linestr,";");
1555             if (preambleav){
1556                 while(AvFILLp(preambleav) >= 0) {
1557                     SV *tmpsv = av_shift(preambleav);
1558                     sv_catsv(linestr, tmpsv);
1559                     sv_catpv(linestr, ";");
1560                     sv_free(tmpsv);
1561                 }
1562                 sv_free((SV*)preambleav);
1563                 preambleav = NULL;
1564             }
1565             if (minus_n || minus_p) {
1566                 sv_catpv(linestr, "LINE: while (<>) {");
1567                 if (minus_l)
1568                     sv_catpv(linestr,"chomp;");
1569                 if (minus_a) {
1570                     GV* gv = gv_fetchpv("::F", TRUE, SVt_PVAV);
1571                     if (gv)
1572                         GvIMPORTED_AV_on(gv);
1573                     if (minus_F) {
1574                         if (strchr("/'\"", *splitstr)
1575                               && strchr(splitstr + 1, *splitstr))
1576                             sv_catpvf(linestr, "@F=split(%s);", splitstr);
1577                         else {
1578                             char delim;
1579                             s = "'~#\200\1'"; /* surely one char is unused...*/
1580                             while (s[1] && strchr(splitstr, *s))  s++;
1581                             delim = *s;
1582                             sv_catpvf(linestr, "@F=split(%s%c",
1583                                       "q" + (delim == '\''), delim);
1584                             for (s = splitstr; *s; s++) {
1585                                 if (*s == '\\')
1586                                     sv_catpvn(linestr, "\\", 1);
1587                                 sv_catpvn(linestr, s, 1);
1588                             }
1589                             sv_catpvf(linestr, "%c);", delim);
1590                         }
1591                     }
1592                     else
1593                         sv_catpv(linestr,"@F=split(' ');");
1594                 }
1595             }
1596             sv_catpv(linestr, "\n");
1597             oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1598             bufend = SvPVX(linestr) + SvCUR(linestr);
1599             if (PERLDB_LINE && curstash != debstash) {
1600                 SV *sv = NEWSV(85,0);
1601
1602                 sv_upgrade(sv, SVt_PVMG);
1603                 sv_setsv(sv,linestr);
1604                 av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
1605             }
1606             goto retry;
1607         }
1608         do {
1609             if ((s = filter_gets(linestr, rsfp, 0)) == Nullch) {
1610               fake_eof:
1611                 if (rsfp) {
1612                     if (preprocess && !in_eval)
1613                         (void)PerlProc_pclose(rsfp);
1614                     else if ((PerlIO *)rsfp == PerlIO_stdin())
1615                         PerlIO_clearerr(rsfp);
1616                     else
1617                         (void)PerlIO_close(rsfp);
1618                     if (e_fp == rsfp)
1619                         e_fp = Nullfp;
1620                     rsfp = Nullfp;
1621                 }
1622                 if (!in_eval && (minus_n || minus_p)) {
1623                     sv_setpv(linestr,minus_p ? ";}continue{print" : "");
1624                     sv_catpv(linestr,";}");
1625                     oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1626                     bufend = SvPVX(linestr) + SvCUR(linestr);
1627                     minus_n = minus_p = 0;
1628                     goto retry;
1629                 }
1630                 oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1631                 sv_setpv(linestr,"");
1632                 TOKEN(';');     /* not infinite loop because rsfp is NULL now */
1633             }
1634             if (doextract) {
1635                 if (*s == '#' && s[1] == '!' && instr(s,"perl"))
1636                     doextract = FALSE;
1637
1638                 /* Incest with pod. */
1639                 if (*s == '=' && strnEQ(s, "=cut", 4)) {
1640                     sv_setpv(linestr, "");
1641                     oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1642                     bufend = SvPVX(linestr) + SvCUR(linestr);
1643                     doextract = FALSE;
1644                 }
1645             }
1646             incline(s);
1647         } while (doextract);
1648         oldoldbufptr = oldbufptr = bufptr = linestart = s;
1649         if (PERLDB_LINE && curstash != debstash) {
1650             SV *sv = NEWSV(85,0);
1651
1652             sv_upgrade(sv, SVt_PVMG);
1653             sv_setsv(sv,linestr);
1654             av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
1655         }
1656         bufend = SvPVX(linestr) + SvCUR(linestr);
1657         if (curcop->cop_line == 1) {
1658             while (s < bufend && isSPACE(*s))
1659                 s++;
1660             if (*s == ':' && s[1] != ':') /* for csh execing sh scripts */
1661                 s++;
1662             d = Nullch;
1663             if (!in_eval) {
1664                 if (*s == '#' && *(s+1) == '!')
1665                     d = s + 2;
1666 #ifdef ALTERNATE_SHEBANG
1667                 else {
1668                     static char as[] = ALTERNATE_SHEBANG;
1669                     if (*s == as[0] && strnEQ(s, as, sizeof(as) - 1))
1670                         d = s + (sizeof(as) - 1);
1671                 }
1672 #endif /* ALTERNATE_SHEBANG */
1673             }
1674             if (d) {
1675                 char *ipath;
1676                 char *ipathend;
1677
1678                 while (isSPACE(*d))
1679                     d++;
1680                 ipath = d;
1681                 while (*d && !isSPACE(*d))
1682                     d++;
1683                 ipathend = d;
1684
1685 #ifdef ARG_ZERO_IS_SCRIPT
1686                 if (ipathend > ipath) {
1687                     /*
1688                      * HP-UX (at least) sets argv[0] to the script name,
1689                      * which makes $^X incorrect.  And Digital UNIX and Linux,
1690                      * at least, set argv[0] to the basename of the Perl
1691                      * interpreter. So, having found "#!", we'll set it right.
1692                      */
1693                     SV *x = GvSV(gv_fetchpv("\030", TRUE, SVt_PV));
1694                     assert(SvPOK(x) || SvGMAGICAL(x));
1695                     if (sv_eq(x, GvSV(curcop->cop_filegv))) {
1696                         sv_setpvn(x, ipath, ipathend - ipath);
1697                         SvSETMAGIC(x);
1698                     }
1699                     TAINT_NOT;  /* $^X is always tainted, but that's OK */
1700                 }
1701 #endif /* ARG_ZERO_IS_SCRIPT */
1702
1703                 /*
1704                  * Look for options.
1705                  */
1706                 d = instr(s,"perl -");
1707                 if (!d)
1708                     d = instr(s,"perl");
1709 #ifdef ALTERNATE_SHEBANG
1710                 /*
1711                  * If the ALTERNATE_SHEBANG on this system starts with a
1712                  * character that can be part of a Perl expression, then if
1713                  * we see it but not "perl", we're probably looking at the
1714                  * start of Perl code, not a request to hand off to some
1715                  * other interpreter.  Similarly, if "perl" is there, but
1716                  * not in the first 'word' of the line, we assume the line
1717                  * contains the start of the Perl program.
1718                  */
1719                 if (d && *s != '#') {
1720                     char *c = ipath;
1721                     while (*c && !strchr("; \t\r\n\f\v#", *c))
1722                         c++;
1723                     if (c < d)
1724                         d = Nullch;     /* "perl" not in first word; ignore */
1725                     else
1726                         *s = '#';       /* Don't try to parse shebang line */
1727                 }
1728 #endif /* ALTERNATE_SHEBANG */
1729                 if (!d &&
1730                     *s == '#' &&
1731                     ipathend > ipath &&
1732                     !minus_c &&
1733                     !instr(s,"indir") &&
1734                     instr(origargv[0],"perl"))
1735                 {
1736                     char **newargv;
1737
1738                     *ipathend = '\0';
1739                     s = ipathend + 1;
1740                     while (s < bufend && isSPACE(*s))
1741                         s++;
1742                     if (s < bufend) {
1743                         Newz(899,newargv,origargc+3,char*);
1744                         newargv[1] = s;
1745                         while (s < bufend && !isSPACE(*s))
1746                             s++;
1747                         *s = '\0';
1748                         Copy(origargv+1, newargv+2, origargc+1, char*);
1749                     }
1750                     else
1751                         newargv = origargv;
1752                     newargv[0] = ipath;
1753                     execv(ipath, newargv);
1754                     croak("Can't exec %s", ipath);
1755                 }
1756                 if (d) {
1757                     U32 oldpdb = perldb;
1758                     bool oldn = minus_n;
1759                     bool oldp = minus_p;
1760
1761                     while (*d && !isSPACE(*d)) d++;
1762                     while (*d == ' ' || *d == '\t') d++;
1763
1764                     if (*d++ == '-') {
1765                         do {
1766                             if (*d == 'M' || *d == 'm') {
1767                                 char *m = d;
1768                                 while (*d && !isSPACE(*d)) d++;
1769                                 croak("Too late for \"-%.*s\" option",
1770                                       (int)(d - m), m);
1771                             }
1772                             d = moreswitches(d);
1773                         } while (d);
1774                         if (PERLDB_LINE && !oldpdb ||
1775                             ( minus_n || minus_p ) && !(oldn || oldp) )
1776                               /* if we have already added "LINE: while (<>) {",
1777                                  we must not do it again */
1778                         {
1779                             sv_setpv(linestr, "");
1780                             oldoldbufptr = oldbufptr = s = linestart = SvPVX(linestr);
1781                             bufend = SvPVX(linestr) + SvCUR(linestr);
1782                             preambled = FALSE;
1783                             if (PERLDB_LINE)
1784                                 (void)gv_fetchfile(origfilename);
1785                             goto retry;
1786                         }
1787                     }
1788                 }
1789             }
1790         }
1791         if (lex_formbrack && lex_brackets <= lex_formbrack) {
1792             bufptr = s;
1793             lex_state = LEX_FORMLINE;
1794             return yylex();
1795         }
1796         goto retry;
1797     case '\r':
1798 #ifndef WIN32CHEAT
1799         warn("Illegal character \\%03o (carriage return)", '\r');
1800         croak(
1801       "(Maybe you didn't strip carriage returns after a network transfer?)\n");
1802 #endif
1803     case ' ': case '\t': case '\f': case 013:
1804         s++;
1805         goto retry;
1806     case '#':
1807     case '\n':
1808         if (lex_state != LEX_NORMAL || (in_eval && !rsfp)) {
1809             d = bufend;
1810             while (s < d && *s != '\n')
1811                 s++;
1812             if (s < d)
1813                 s++;
1814             incline(s);
1815             if (lex_formbrack && lex_brackets <= lex_formbrack) {
1816                 bufptr = s;
1817                 lex_state = LEX_FORMLINE;
1818                 return yylex();
1819             }
1820         }
1821         else {
1822             *s = '\0';
1823             bufend = s;
1824         }
1825         goto retry;
1826     case '-':
1827         if (s[1] && isALPHA(s[1]) && !isALNUM(s[2])) {
1828             s++;
1829             bufptr = s;
1830             tmp = *s++;
1831
1832             while (s < bufend && (*s == ' ' || *s == '\t'))
1833                 s++;
1834
1835             if (strnEQ(s,"=>",2)) {
1836                 if (dowarn)
1837                     warn("Ambiguous use of -%c => resolved to \"-%c\" =>",
1838                         (int)tmp, (int)tmp);
1839                 s = force_word(bufptr,WORD,FALSE,FALSE,FALSE);
1840                 OPERATOR('-');          /* unary minus */
1841             }
1842             last_uni = oldbufptr;
1843             last_lop_op = OP_FTEREAD;   /* good enough */
1844             switch (tmp) {
1845             case 'r': FTST(OP_FTEREAD);
1846             case 'w': FTST(OP_FTEWRITE);
1847             case 'x': FTST(OP_FTEEXEC);
1848             case 'o': FTST(OP_FTEOWNED);
1849             case 'R': FTST(OP_FTRREAD);
1850             case 'W': FTST(OP_FTRWRITE);
1851             case 'X': FTST(OP_FTREXEC);
1852             case 'O': FTST(OP_FTROWNED);
1853             case 'e': FTST(OP_FTIS);
1854             case 'z': FTST(OP_FTZERO);
1855             case 's': FTST(OP_FTSIZE);
1856             case 'f': FTST(OP_FTFILE);
1857             case 'd': FTST(OP_FTDIR);
1858             case 'l': FTST(OP_FTLINK);
1859             case 'p': FTST(OP_FTPIPE);
1860             case 'S': FTST(OP_FTSOCK);
1861             case 'u': FTST(OP_FTSUID);
1862             case 'g': FTST(OP_FTSGID);
1863             case 'k': FTST(OP_FTSVTX);
1864             case 'b': FTST(OP_FTBLK);
1865             case 'c': FTST(OP_FTCHR);
1866             case 't': FTST(OP_FTTTY);
1867             case 'T': FTST(OP_FTTEXT);
1868             case 'B': FTST(OP_FTBINARY);
1869             case 'M': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTMTIME);
1870             case 'A': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTATIME);
1871             case 'C': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTCTIME);
1872             default:
1873                 croak("Unrecognized file test: -%c", (int)tmp);
1874                 break;
1875             }
1876         }
1877         tmp = *s++;
1878         if (*s == tmp) {
1879             s++;
1880             if (expect == XOPERATOR)
1881                 TERM(POSTDEC);
1882             else
1883                 OPERATOR(PREDEC);
1884         }
1885         else if (*s == '>') {
1886             s++;
1887             s = skipspace(s);
1888             if (isIDFIRST(*s)) {
1889                 s = force_word(s,METHOD,FALSE,TRUE,FALSE);
1890                 TOKEN(ARROW);
1891             }
1892             else if (*s == '$')
1893                 OPERATOR(ARROW);
1894             else
1895                 TERM(ARROW);
1896         }
1897         if (expect == XOPERATOR)
1898             Aop(OP_SUBTRACT);
1899         else {
1900             if (isSPACE(*s) || !isSPACE(*bufptr))
1901                 check_uni();
1902             OPERATOR('-');              /* unary minus */
1903         }
1904
1905     case '+':
1906         tmp = *s++;
1907         if (*s == tmp) {
1908             s++;
1909             if (expect == XOPERATOR)
1910                 TERM(POSTINC);
1911             else
1912                 OPERATOR(PREINC);
1913         }
1914         if (expect == XOPERATOR)
1915             Aop(OP_ADD);
1916         else {
1917             if (isSPACE(*s) || !isSPACE(*bufptr))
1918                 check_uni();
1919             OPERATOR('+');
1920         }
1921
1922     case '*':
1923         if (expect != XOPERATOR) {
1924             s = scan_ident(s, bufend, tokenbuf, sizeof tokenbuf, TRUE);
1925             expect = XOPERATOR;
1926             force_ident(tokenbuf, '*');
1927             if (!*tokenbuf)
1928                 PREREF('*');
1929             TERM('*');
1930         }
1931         s++;
1932         if (*s == '*') {
1933             s++;
1934             PWop(OP_POW);
1935         }
1936         Mop(OP_MULTIPLY);
1937
1938     case '%':
1939         if (expect == XOPERATOR) {
1940             ++s;
1941             Mop(OP_MODULO);
1942         }
1943         tokenbuf[0] = '%';
1944         s = scan_ident(s, bufend, tokenbuf + 1, sizeof tokenbuf - 1, TRUE);
1945         if (!tokenbuf[1]) {
1946             if (s == bufend)
1947                 yyerror("Final % should be \\% or %name");
1948             PREREF('%');
1949         }
1950         pending_ident = '%';
1951         TERM('%');
1952
1953     case '^':
1954         s++;
1955         BOop(OP_BIT_XOR);
1956     case '[':
1957         lex_brackets++;
1958         /* FALL THROUGH */
1959     case '~':
1960     case ',':
1961         tmp = *s++;
1962         OPERATOR(tmp);
1963     case ':':
1964         if (s[1] == ':') {
1965             len = 0;
1966             goto just_a_word;
1967         }
1968         s++;
1969         OPERATOR(':');
1970     case '(':
1971         s++;
1972         if (last_lop == oldoldbufptr || last_uni == oldoldbufptr)
1973             oldbufptr = oldoldbufptr;           /* allow print(STDOUT 123) */
1974         else
1975             expect = XTERM;
1976         TOKEN('(');
1977     case ';':
1978         if (curcop->cop_line < copline)
1979             copline = curcop->cop_line;
1980         tmp = *s++;
1981         OPERATOR(tmp);
1982     case ')':
1983         tmp = *s++;
1984         s = skipspace(s);
1985         if (*s == '{')
1986             PREBLOCK(tmp);
1987         TERM(tmp);
1988     case ']':
1989         s++;
1990         if (lex_brackets <= 0)
1991             yyerror("Unmatched right bracket");
1992         else
1993             --lex_brackets;
1994         if (lex_state == LEX_INTERPNORMAL) {
1995             if (lex_brackets == 0) {
1996                 if (*s != '[' && *s != '{' && (*s != '-' || s[1] != '>'))
1997                     lex_state = LEX_INTERPEND;
1998             }
1999         }
2000         TERM(']');
2001     case '{':
2002       leftbracket:
2003         s++;
2004         if (lex_brackets > 100) {
2005             char* newlb = Renew(lex_brackstack, lex_brackets + 1, char);
2006             if (newlb != lex_brackstack) {
2007                 SAVEFREEPV(newlb);
2008                 lex_brackstack = newlb;
2009             }
2010         }
2011         switch (expect) {
2012         case XTERM:
2013             if (lex_formbrack) {
2014                 s--;
2015                 PRETERMBLOCK(DO);
2016             }
2017             if (oldoldbufptr == last_lop)
2018                 lex_brackstack[lex_brackets++] = XTERM;
2019             else
2020                 lex_brackstack[lex_brackets++] = XOPERATOR;
2021             OPERATOR(HASHBRACK);
2022         case XOPERATOR:
2023             while (s < bufend && (*s == ' ' || *s == '\t'))
2024                 s++;
2025             d = s;
2026             tokenbuf[0] = '\0';
2027             if (d < bufend && *d == '-') {
2028                 tokenbuf[0] = '-';
2029                 d++;
2030                 while (d < bufend && (*d == ' ' || *d == '\t'))
2031                     d++;
2032             }
2033             if (d < bufend && isIDFIRST(*d)) {
2034                 d = scan_word(d, tokenbuf + 1, sizeof tokenbuf - 1,
2035                               FALSE, &len);
2036                 while (d < bufend && (*d == ' ' || *d == '\t'))
2037                     d++;
2038                 if (*d == '}') {
2039                     char minus = (tokenbuf[0] == '-');
2040                     if (dowarn &&
2041                         (keyword(tokenbuf + 1, len) ||
2042                          (minus && len == 1 && isALPHA(tokenbuf[1])) ||
2043                          perl_get_cv(tokenbuf + 1, FALSE) ))
2044                         warn("Ambiguous use of {%s} resolved to {\"%s\"}",
2045                              tokenbuf + !minus, tokenbuf + !minus);
2046                     s = force_word(s + minus, WORD, FALSE, TRUE, FALSE);
2047                     if (minus)
2048                         force_next('-');
2049                 }
2050             }
2051             /* FALL THROUGH */
2052         case XBLOCK:
2053             lex_brackstack[lex_brackets++] = XSTATE;
2054             expect = XSTATE;
2055             break;
2056         case XTERMBLOCK:
2057             lex_brackstack[lex_brackets++] = XOPERATOR;
2058             expect = XSTATE;
2059             break;
2060         default: {
2061                 char *t;
2062                 if (oldoldbufptr == last_lop)
2063                     lex_brackstack[lex_brackets++] = XTERM;
2064                 else
2065                     lex_brackstack[lex_brackets++] = XOPERATOR;
2066                 s = skipspace(s);
2067                 if (*s == '}') {
2068                     if (expect == XSTATE) {
2069                         lex_brackstack[lex_brackets-1] = XSTATE;
2070                         break;
2071                     }
2072                     OPERATOR(HASHBRACK);
2073                 }
2074                 /* This hack serves to disambiguate a pair of curlies
2075                  * as being a block or an anon hash.  Normally, expectation
2076                  * determines that, but in cases where we're not in a
2077                  * position to expect anything in particular (like inside
2078                  * eval"") we have to resolve the ambiguity.  This code
2079                  * covers the case where the first term in the curlies is a
2080                  * quoted string.  Most other cases need to be explicitly
2081                  * disambiguated by prepending a `+' before the opening
2082                  * curly in order to force resolution as an anon hash.
2083                  *
2084                  * XXX should probably propagate the outer expectation
2085                  * into eval"" to rely less on this hack, but that could
2086                  * potentially break current behavior of eval"".
2087                  * GSAR 97-07-21
2088                  */
2089                 t = s;
2090                 if (*s == '\'' || *s == '"' || *s == '`') {
2091                     /* common case: get past first string, handling escapes */
2092                     for (t++; t < bufend && *t != *s;)
2093                         if (*t++ == '\\' && (*t == '\\' || *t == *s))
2094                             t++;
2095                     t++;
2096                 }
2097                 else if (*s == 'q') {
2098                     if (++t < bufend
2099                         && (!isALNUM(*t)
2100                             || ((*t == 'q' || *t == 'x') && ++t < bufend
2101                                 && !isALNUM(*t)))) {
2102                         char *tmps;
2103                         char open, close, term;
2104                         I32 brackets = 1;
2105
2106                         while (t < bufend && isSPACE(*t))
2107                             t++;
2108                         term = *t;
2109                         open = term;
2110                         if (term && (tmps = strchr("([{< )]}> )]}>",term)))
2111                             term = tmps[5];
2112                         close = term;
2113                         if (open == close)
2114                             for (t++; t < bufend; t++) {
2115                                 if (*t == '\\' && t+1 < bufend && open != '\\')
2116                                     t++;
2117                                 else if (*t == open)
2118                                     break;
2119                             }
2120                         else
2121                             for (t++; t < bufend; t++) {
2122                                 if (*t == '\\' && t+1 < bufend)
2123                                     t++;
2124                                 else if (*t == close && --brackets <= 0)
2125                                     break;
2126                                 else if (*t == open)
2127                                     brackets++;
2128                             }
2129                     }
2130                     t++;
2131                 }
2132                 else if (isALPHA(*s)) {
2133                     for (t++; t < bufend && isALNUM(*t); t++) ;
2134                 }
2135                 while (t < bufend && isSPACE(*t))
2136                     t++;
2137                 /* if comma follows first term, call it an anon hash */
2138                 /* XXX it could be a comma expression with loop modifiers */
2139                 if (t < bufend && ((*t == ',' && (*s == 'q' || !isLOWER(*s)))
2140                                    || (*t == '=' && t[1] == '>')))
2141                     OPERATOR(HASHBRACK);
2142                 if (expect == XREF)
2143                     expect = XTERM;
2144                 else {
2145                     lex_brackstack[lex_brackets-1] = XSTATE;
2146                     expect = XSTATE;
2147                 }
2148             }
2149             break;
2150         }
2151         yylval.ival = curcop->cop_line;
2152         if (isSPACE(*s) || *s == '#')
2153             copline = NOLINE;   /* invalidate current command line number */
2154         TOKEN('{');
2155     case '}':
2156       rightbracket:
2157         s++;
2158         if (lex_brackets <= 0)
2159             yyerror("Unmatched right bracket");
2160         else
2161             expect = (expectation)lex_brackstack[--lex_brackets];
2162         if (lex_brackets < lex_formbrack)
2163             lex_formbrack = 0;
2164         if (lex_state == LEX_INTERPNORMAL) {
2165             if (lex_brackets == 0) {
2166                 if (lex_fakebrack) {
2167                     lex_state = LEX_INTERPEND;
2168                     bufptr = s;
2169                     return yylex();             /* ignore fake brackets */
2170                 }
2171                 if (*s == '-' && s[1] == '>')
2172                     lex_state = LEX_INTERPENDMAYBE;
2173                 else if (*s != '[' && *s != '{')
2174                     lex_state = LEX_INTERPEND;
2175             }
2176         }
2177         if (lex_brackets < lex_fakebrack) {
2178             bufptr = s;
2179             lex_fakebrack = 0;
2180             return yylex();             /* ignore fake brackets */
2181         }
2182         force_next('}');
2183         TOKEN(';');
2184     case '&':
2185         s++;
2186         tmp = *s++;
2187         if (tmp == '&')
2188             AOPERATOR(ANDAND);
2189         s--;
2190         if (expect == XOPERATOR) {
2191             if (dowarn && isALPHA(*s) && bufptr == linestart) {
2192                 curcop->cop_line--;
2193                 warn(warn_nosemi);
2194                 curcop->cop_line++;
2195             }
2196             BAop(OP_BIT_AND);
2197         }
2198
2199         s = scan_ident(s - 1, bufend, tokenbuf, sizeof tokenbuf, TRUE);
2200         if (*tokenbuf) {
2201             expect = XOPERATOR;
2202             force_ident(tokenbuf, '&');
2203         }
2204         else
2205             PREREF('&');
2206         yylval.ival = (OPpENTERSUB_AMPER<<8);
2207         TERM('&');
2208
2209     case '|':
2210         s++;
2211         tmp = *s++;
2212         if (tmp == '|')
2213             AOPERATOR(OROR);
2214         s--;
2215         BOop(OP_BIT_OR);
2216     case '=':
2217         s++;
2218         tmp = *s++;
2219         if (tmp == '=')
2220             Eop(OP_EQ);
2221         if (tmp == '>')
2222             OPERATOR(',');
2223         if (tmp == '~')
2224             PMop(OP_MATCH);
2225         if (dowarn && tmp && isSPACE(*s) && strchr("+-*/%.^&|<",tmp))
2226             warn("Reversed %c= operator",(int)tmp);
2227         s--;
2228         if (expect == XSTATE && isALPHA(tmp) &&
2229                 (s == linestart+1 || s[-2] == '\n') )
2230         {
2231             if (in_eval && !rsfp) {
2232                 d = bufend;
2233                 while (s < d) {
2234                     if (*s++ == '\n') {
2235                         incline(s);
2236                         if (strnEQ(s,"=cut",4)) {
2237                             s = strchr(s,'\n');
2238                             if (s)
2239                                 s++;
2240                             else
2241                                 s = d;
2242                             incline(s);
2243                             goto retry;
2244                         }
2245                     }
2246                 }
2247                 goto retry;
2248             }
2249             s = bufend;
2250             doextract = TRUE;
2251             goto retry;
2252         }
2253         if (lex_brackets < lex_formbrack) {
2254             char *t;
2255             for (t = s; *t == ' ' || *t == '\t'; t++) ;
2256             if (*t == '\n' || *t == '#') {
2257                 s--;
2258                 expect = XBLOCK;
2259                 goto leftbracket;
2260             }
2261         }
2262         yylval.ival = 0;
2263         OPERATOR(ASSIGNOP);
2264     case '!':
2265         s++;
2266         tmp = *s++;
2267         if (tmp == '=')
2268             Eop(OP_NE);
2269         if (tmp == '~')
2270             PMop(OP_NOT);
2271         s--;
2272         OPERATOR('!');
2273     case '<':
2274         if (expect != XOPERATOR) {
2275             if (s[1] != '<' && !strchr(s,'>'))
2276                 check_uni();
2277             if (s[1] == '<')
2278                 s = scan_heredoc(s);
2279             else
2280                 s = scan_inputsymbol(s);
2281             TERM(sublex_start());
2282         }
2283         s++;
2284         tmp = *s++;
2285         if (tmp == '<')
2286             SHop(OP_LEFT_SHIFT);
2287         if (tmp == '=') {
2288             tmp = *s++;
2289             if (tmp == '>')
2290                 Eop(OP_NCMP);
2291             s--;
2292             Rop(OP_LE);
2293         }
2294         s--;
2295         Rop(OP_LT);
2296     case '>':
2297         s++;
2298         tmp = *s++;
2299         if (tmp == '>')
2300             SHop(OP_RIGHT_SHIFT);
2301         if (tmp == '=')
2302             Rop(OP_GE);
2303         s--;
2304         Rop(OP_GT);
2305
2306     case '$':
2307         CLINE;
2308
2309         if (expect == XOPERATOR) {
2310             if (lex_formbrack && lex_brackets == lex_formbrack) {
2311                 expect = XTERM;
2312                 depcom();
2313                 return ','; /* grandfather non-comma-format format */
2314             }
2315         }
2316
2317         if (s[1] == '#' && (isALPHA(s[2]) || strchr("_{$:", s[2]))) {
2318             if (expect == XOPERATOR)
2319                 no_op("Array length", bufptr);
2320             tokenbuf[0] = '@';
2321             s = scan_ident(s + 1, bufend, tokenbuf + 1, sizeof tokenbuf - 1,
2322                            FALSE);
2323             if (!tokenbuf[1])
2324                 PREREF(DOLSHARP);
2325             expect = XOPERATOR;
2326             pending_ident = '#';
2327             TOKEN(DOLSHARP);
2328         }
2329
2330         if (expect == XOPERATOR)
2331             no_op("Scalar", bufptr);
2332         tokenbuf[0] = '$';
2333         s = scan_ident(s, bufend, tokenbuf + 1, sizeof tokenbuf - 1, FALSE);
2334         if (!tokenbuf[1]) {
2335             if (s == bufend)
2336                 yyerror("Final $ should be \\$ or $name");
2337             PREREF('$');
2338         }
2339
2340         /* This kludge not intended to be bulletproof. */
2341         if (tokenbuf[1] == '[' && !tokenbuf[2]) {
2342             yylval.opval = newSVOP(OP_CONST, 0,
2343                                    newSViv((IV)compiling.cop_arybase));
2344             yylval.opval->op_private = OPpCONST_ARYBASE;
2345             TERM(THING);
2346         }
2347
2348         d = s;
2349         if (lex_state == LEX_NORMAL)
2350             s = skipspace(s);
2351
2352         if ((expect != XREF || oldoldbufptr == last_lop) && intuit_more(s)) {
2353             char *t;
2354             if (*s == '[') {
2355                 tokenbuf[0] = '@';
2356                 if (dowarn) {
2357                     for(t = s + 1;
2358                         isSPACE(*t) || isALNUM(*t) || *t == '$';
2359                         t++) ;
2360                     if (*t++ == ',') {
2361                         bufptr = skipspace(bufptr);
2362                         while (t < bufend && *t != ']')
2363                             t++;
2364                         warn("Multidimensional syntax %.*s not supported",
2365                              (t - bufptr) + 1, bufptr);
2366                     }
2367                 }
2368             }
2369             else if (*s == '{') {
2370                 tokenbuf[0] = '%';
2371                 if (dowarn && strEQ(tokenbuf+1, "SIG") &&
2372                     (t = strchr(s, '}')) && (t = strchr(t, '=')))
2373                 {
2374                     char tmpbuf[sizeof tokenbuf];
2375                     STRLEN len;
2376                     for (t++; isSPACE(*t); t++) ;
2377                     if (isIDFIRST(*t)) {
2378                         t = scan_word(t, tmpbuf, sizeof tmpbuf, TRUE, &len);
2379                         if (*t != '(' && perl_get_cv(tmpbuf, FALSE))
2380                             warn("You need to quote \"%s\"", tmpbuf);
2381                     }
2382                 }
2383             }
2384         }
2385
2386         expect = XOPERATOR;
2387         if (lex_state == LEX_NORMAL && isSPACE(*d)) {
2388             bool islop = (last_lop == oldoldbufptr);
2389             if (!islop || last_lop_op == OP_GREPSTART)
2390                 expect = XOPERATOR;
2391             else if (strchr("$@\"'`q", *s))
2392                 expect = XTERM;         /* e.g. print $fh "foo" */
2393             else if (strchr("&*<%", *s) && isIDFIRST(s[1]))
2394                 expect = XTERM;         /* e.g. print $fh &sub */
2395             else if (isIDFIRST(*s)) {
2396                 char tmpbuf[sizeof tokenbuf];
2397                 scan_word(s, tmpbuf, sizeof tmpbuf, TRUE, &len);
2398                 if (tmp = keyword(tmpbuf, len)) {
2399                     /* binary operators exclude handle interpretations */
2400                     switch (tmp) {
2401                     case -KEY_x:
2402                     case -KEY_eq:
2403                     case -KEY_ne:
2404                     case -KEY_gt:
2405                     case -KEY_lt:
2406                     case -KEY_ge:
2407                     case -KEY_le:
2408                     case -KEY_cmp:
2409                         break;
2410                     default:
2411                         expect = XTERM; /* e.g. print $fh length() */
2412                         break;
2413                     }
2414                 }
2415                 else {
2416                     GV *gv = gv_fetchpv(tmpbuf, FALSE, SVt_PVCV);
2417                     if (gv && GvCVu(gv))
2418                         expect = XTERM; /* e.g. print $fh subr() */
2419                 }
2420             }
2421             else if (isDIGIT(*s))
2422                 expect = XTERM;         /* e.g. print $fh 3 */
2423             else if (*s == '.' && isDIGIT(s[1]))
2424                 expect = XTERM;         /* e.g. print $fh .3 */
2425             else if (strchr("/?-+", *s) && !isSPACE(s[1]))
2426                 expect = XTERM;         /* e.g. print $fh -1 */
2427             else if (*s == '<' && s[1] == '<' && !isSPACE(s[2]))
2428                 expect = XTERM;         /* print $fh <<"EOF" */
2429         }
2430         pending_ident = '$';
2431         TOKEN('$');
2432
2433     case '@':
2434         if (expect == XOPERATOR)
2435             no_op("Array", s);
2436         tokenbuf[0] = '@';
2437         s = scan_ident(s, bufend, tokenbuf + 1, sizeof tokenbuf - 1, FALSE);
2438         if (!tokenbuf[1]) {
2439             if (s == bufend)
2440                 yyerror("Final @ should be \\@ or @name");
2441             PREREF('@');
2442         }
2443         if (lex_state == LEX_NORMAL)
2444             s = skipspace(s);
2445         if ((expect != XREF || oldoldbufptr == last_lop) && intuit_more(s)) {
2446             if (*s == '{')
2447                 tokenbuf[0] = '%';
2448
2449             /* Warn about @ where they meant $. */
2450             if (dowarn) {
2451                 if (*s == '[' || *s == '{') {
2452                     char *t = s + 1;
2453                     while (*t && (isALNUM(*t) || strchr(" \t$#+-'\"", *t)))
2454                         t++;
2455                     if (*t == '}' || *t == ']') {
2456                         t++;
2457                         bufptr = skipspace(bufptr);
2458                         warn("Scalar value %.*s better written as $%.*s",
2459                             t-bufptr, bufptr, t-bufptr-1, bufptr+1);
2460                     }
2461                 }
2462             }
2463         }
2464         pending_ident = '@';
2465         TERM('@');
2466
2467     case '/':                   /* may either be division or pattern */
2468     case '?':                   /* may either be conditional or pattern */
2469         if (expect != XOPERATOR) {
2470             /* Disable warning on "study /blah/" */
2471             if (oldoldbufptr == last_uni 
2472                 && (*last_uni != 's' || s - last_uni < 5 
2473                     || memNE(last_uni, "study", 5) || isALNUM(last_uni[5])))
2474                 check_uni();
2475             s = scan_pat(s);
2476             TERM(sublex_start());
2477         }
2478         tmp = *s++;
2479         if (tmp == '/')
2480             Mop(OP_DIVIDE);
2481         OPERATOR(tmp);
2482
2483     case '.':
2484         if (lex_formbrack && lex_brackets == lex_formbrack && s[1] == '\n' &&
2485                 (s == linestart || s[-1] == '\n') ) {
2486             lex_formbrack = 0;
2487             expect = XSTATE;
2488             goto rightbracket;
2489         }
2490         if (expect == XOPERATOR || !isDIGIT(s[1])) {
2491             tmp = *s++;
2492             if (*s == tmp) {
2493                 s++;
2494                 if (*s == tmp) {
2495                     s++;
2496                     yylval.ival = OPf_SPECIAL;
2497                 }
2498                 else
2499                     yylval.ival = 0;
2500                 OPERATOR(DOTDOT);
2501             }
2502             if (expect != XOPERATOR)
2503                 check_uni();
2504             Aop(OP_CONCAT);
2505         }
2506         /* FALL THROUGH */
2507     case '0': case '1': case '2': case '3': case '4':
2508     case '5': case '6': case '7': case '8': case '9':
2509         s = scan_num(s);
2510         if (expect == XOPERATOR)
2511             no_op("Number",s);
2512         TERM(THING);
2513
2514     case '\'':
2515         s = scan_str(s);
2516         if (expect == XOPERATOR) {
2517             if (lex_formbrack && lex_brackets == lex_formbrack) {
2518                 expect = XTERM;
2519                 depcom();
2520                 return ',';     /* grandfather non-comma-format format */
2521             }
2522             else
2523                 no_op("String",s);
2524         }
2525         if (!s)
2526             missingterm((char*)0);
2527         yylval.ival = OP_CONST;
2528         TERM(sublex_start());
2529
2530     case '"':
2531         s = scan_str(s);
2532         if (expect == XOPERATOR) {
2533             if (lex_formbrack && lex_brackets == lex_formbrack) {
2534                 expect = XTERM;
2535                 depcom();
2536                 return ',';     /* grandfather non-comma-format format */
2537             }
2538             else
2539                 no_op("String",s);
2540         }
2541         if (!s)
2542             missingterm((char*)0);
2543         yylval.ival = OP_CONST;
2544         for (d = SvPV(lex_stuff, len); len; len--, d++) {
2545             if (*d == '$' || *d == '@' || *d == '\\') {
2546                 yylval.ival = OP_STRINGIFY;
2547                 break;
2548             }
2549         }
2550         TERM(sublex_start());
2551
2552     case '`':
2553         s = scan_str(s);
2554         if (expect == XOPERATOR)
2555             no_op("Backticks",s);
2556         if (!s)
2557             missingterm((char*)0);
2558         yylval.ival = OP_BACKTICK;
2559         set_csh();
2560         TERM(sublex_start());
2561
2562     case '\\':
2563         s++;
2564         if (dowarn && lex_inwhat && isDIGIT(*s))
2565             warn("Can't use \\%c to mean $%c in expression", *s, *s);
2566         if (expect == XOPERATOR)
2567             no_op("Backslash",s);
2568         OPERATOR(REFGEN);
2569
2570     case 'x':
2571         if (isDIGIT(s[1]) && expect == XOPERATOR) {
2572             s++;
2573             Mop(OP_REPEAT);
2574         }
2575         goto keylookup;
2576
2577     case '_':
2578     case 'a': case 'A':
2579     case 'b': case 'B':
2580     case 'c': case 'C':
2581     case 'd': case 'D':
2582     case 'e': case 'E':
2583     case 'f': case 'F':
2584     case 'g': case 'G':
2585     case 'h': case 'H':
2586     case 'i': case 'I':
2587     case 'j': case 'J':
2588     case 'k': case 'K':
2589     case 'l': case 'L':
2590     case 'm': case 'M':
2591     case 'n': case 'N':
2592     case 'o': case 'O':
2593     case 'p': case 'P':
2594     case 'q': case 'Q':
2595     case 'r': case 'R':
2596     case 's': case 'S':
2597     case 't': case 'T':
2598     case 'u': case 'U':
2599     case 'v': case 'V':
2600     case 'w': case 'W':
2601               case 'X':
2602     case 'y': case 'Y':
2603     case 'z': case 'Z':
2604
2605       keylookup: {
2606         gv = Nullgv;
2607         gvp = 0;
2608
2609         bufptr = s;
2610         s = scan_word(s, tokenbuf, sizeof tokenbuf, FALSE, &len);
2611
2612         /* Some keywords can be followed by any delimiter, including ':' */
2613         tmp = (len == 1 && strchr("msyq", tokenbuf[0]) ||
2614                len == 2 && ((tokenbuf[0] == 't' && tokenbuf[1] == 'r') ||
2615                             (tokenbuf[0] == 'q' &&
2616                              strchr("qwx", tokenbuf[1]))));
2617
2618         /* x::* is just a word, unless x is "CORE" */
2619         if (!tmp && *s == ':' && s[1] == ':' && strNE(tokenbuf, "CORE"))
2620             goto just_a_word;
2621
2622         d = s;
2623         while (d < bufend && isSPACE(*d))
2624                 d++;    /* no comments skipped here, or s### is misparsed */
2625
2626         /* Is this a label? */
2627         if (!tmp && expect == XSTATE
2628               && d < bufend && *d == ':' && *(d + 1) != ':') {
2629             s = d + 1;
2630             yylval.pval = savepv(tokenbuf);
2631             CLINE;
2632             TOKEN(LABEL);
2633         }
2634
2635         /* Check for keywords */
2636         tmp = keyword(tokenbuf, len);
2637
2638         /* Is this a word before a => operator? */
2639         if (strnEQ(d,"=>",2)) {
2640             CLINE;
2641             if (dowarn && (tmp || perl_get_cv(tokenbuf, FALSE)))
2642                 warn("Ambiguous use of %s => resolved to \"%s\" =>",
2643                         tokenbuf, tokenbuf);
2644             yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf,0));
2645             yylval.opval->op_private = OPpCONST_BARE;
2646             TERM(WORD);
2647         }
2648
2649         if (tmp < 0) {                  /* second-class keyword? */
2650             if (expect != XOPERATOR && (*s != ':' || s[1] != ':') &&
2651                 (((gv = gv_fetchpv(tokenbuf, FALSE, SVt_PVCV)) &&
2652                   GvCVu(gv) && GvIMPORTED_CV(gv)) ||
2653                  ((gvp = (GV**)hv_fetch(globalstash,tokenbuf,len,FALSE)) &&
2654                   (gv = *gvp) != (GV*)&sv_undef &&
2655                   GvCVu(gv) && GvIMPORTED_CV(gv))))
2656             {
2657                 tmp = 0;                /* overridden by importation */
2658             }
2659             else if (gv && !gvp
2660                      && -tmp==KEY_lock  /* XXX generalizable kludge */
2661                      && !hv_fetch(GvHVn(incgv), "Thread.pm", 9, FALSE))
2662             {
2663                 tmp = 0;                /* any sub overrides "weak" keyword */
2664             }
2665             else {
2666                 tmp = -tmp; gv = Nullgv; gvp = 0;
2667             }
2668         }
2669
2670       reserved_word:
2671         switch (tmp) {
2672
2673         default:                        /* not a keyword */
2674           just_a_word: {
2675                 SV *sv;
2676                 char lastchar = (bufptr == oldoldbufptr ? 0 : bufptr[-1]);
2677
2678                 /* Get the rest if it looks like a package qualifier */
2679
2680                 if (*s == '\'' || *s == ':' && s[1] == ':') {
2681                     s = scan_word(s, tokenbuf + len, sizeof tokenbuf - len,
2682                                   TRUE, &len);
2683                     if (!len)
2684                         croak("Bad name after %s::", tokenbuf);
2685                 }
2686
2687                 if (expect == XOPERATOR) {
2688                     if (bufptr == linestart) {
2689                         curcop->cop_line--;
2690                         warn(warn_nosemi);
2691                         curcop->cop_line++;
2692                     }
2693                     else
2694                         no_op("Bareword",s);
2695                 }
2696
2697                 /* Look for a subroutine with this name in current package. */
2698
2699                 if (gvp) {
2700                     sv = newSVpv("CORE::GLOBAL::",14);
2701                     sv_catpv(sv,tokenbuf);
2702                 }
2703                 else
2704                     sv = newSVpv(tokenbuf,0);
2705                 if (!gv)
2706                     gv = gv_fetchpv(tokenbuf,FALSE, SVt_PVCV);
2707
2708                 /* Presume this is going to be a bareword of some sort. */
2709
2710                 CLINE;
2711                 yylval.opval = (OP*)newSVOP(OP_CONST, 0, sv);
2712                 yylval.opval->op_private = OPpCONST_BARE;
2713
2714                 /* See if it's the indirect object for a list operator. */
2715
2716                 if (oldoldbufptr &&
2717                     oldoldbufptr < bufptr &&
2718                     (oldoldbufptr == last_lop || oldoldbufptr == last_uni) &&
2719                     /* NO SKIPSPACE BEFORE HERE! */
2720                     (expect == XREF ||
2721                      ((opargs[last_lop_op] >> OASHIFT)& 7) == OA_FILEREF) )
2722                 {
2723                     bool immediate_paren = *s == '(';
2724
2725                     /* (Now we can afford to cross potential line boundary.) */
2726                     s = skipspace(s);
2727
2728                     /* Two barewords in a row may indicate method call. */
2729
2730                     if ((isALPHA(*s) || *s == '$') && (tmp=intuit_method(s,gv)))
2731                         return tmp;
2732
2733                     /* If not a declared subroutine, it's an indirect object. */
2734                     /* (But it's an indir obj regardless for sort.) */
2735
2736                     if ((last_lop_op == OP_SORT ||
2737                          (!immediate_paren && (!gv || !GvCVu(gv))) ) &&
2738                         (last_lop_op != OP_MAPSTART && last_lop_op != OP_GREPSTART)){
2739                         expect = (last_lop == oldoldbufptr) ? XTERM : XOPERATOR;
2740                         goto bareword;
2741                     }
2742                 }
2743
2744                 /* If followed by a paren, it's certainly a subroutine. */
2745
2746                 expect = XOPERATOR;
2747                 s = skipspace(s);
2748                 if (*s == '(') {
2749                     CLINE;
2750                     if (gv && GvCVu(gv)) {
2751                         for (d = s + 1; *d == ' ' || *d == '\t'; d++) ;
2752                         if (*d == ')' && (sv = cv_const_sv(GvCV(gv)))) {
2753                             s = d + 1;
2754                             goto its_constant;
2755                         }
2756                     }
2757                     nextval[nexttoke].opval = yylval.opval;
2758                     expect = XOPERATOR;
2759                     force_next(WORD);
2760                     yylval.ival = 0;
2761                     TOKEN('&');
2762                 }
2763
2764                 /* If followed by var or block, call it a method (unless sub) */
2765
2766                 if ((*s == '$' || *s == '{') && (!gv || !GvCVu(gv))) {
2767                     last_lop = oldbufptr;
2768                     last_lop_op = OP_METHOD;
2769                     PREBLOCK(METHOD);
2770                 }
2771
2772                 /* If followed by a bareword, see if it looks like indir obj. */
2773
2774                 if ((isALPHA(*s) || *s == '$') && (tmp = intuit_method(s,gv)))
2775                     return tmp;
2776
2777                 /* Not a method, so call it a subroutine (if defined) */
2778
2779                 if (gv && GvCVu(gv)) {
2780                     CV* cv;
2781                     if (lastchar == '-')
2782                         warn("Ambiguous use of -%s resolved as -&%s()",
2783                                 tokenbuf, tokenbuf);
2784                     last_lop = oldbufptr;
2785                     last_lop_op = OP_ENTERSUB;
2786                     /* Check for a constant sub */
2787                     cv = GvCV(gv);
2788                     if ((sv = cv_const_sv(cv))) {
2789                   its_constant:
2790                         SvREFCNT_dec(((SVOP*)yylval.opval)->op_sv);
2791                         ((SVOP*)yylval.opval)->op_sv = SvREFCNT_inc(sv);
2792                         yylval.opval->op_private = 0;
2793                         TOKEN(WORD);
2794                     }
2795
2796                     /* Resolve to GV now. */
2797                     op_free(yylval.opval);
2798                     yylval.opval = newCVREF(0, newGVOP(OP_GV, 0, gv));
2799                     /* Is there a prototype? */
2800                     if (SvPOK(cv)) {
2801                         STRLEN len;
2802                         char *proto = SvPV((SV*)cv, len);
2803                         if (!len)
2804                             TERM(FUNC0SUB);
2805                         if (strEQ(proto, "$"))
2806                             OPERATOR(UNIOPSUB);
2807                         if (*proto == '&' && *s == '{') {
2808                             sv_setpv(subname,"__ANON__");
2809                             PREBLOCK(LSTOPSUB);
2810                         }
2811                     }
2812                     nextval[nexttoke].opval = yylval.opval;
2813                     expect = XTERM;
2814                     force_next(WORD);
2815                     TOKEN(NOAMP);
2816                 }
2817
2818                 if (hints & HINT_STRICT_SUBS &&
2819                     lastchar != '-' &&
2820                     strnNE(s,"->",2) &&
2821                     last_lop_op != OP_TRUNCATE &&  /* S/F prototype in opcode.pl */
2822                     last_lop_op != OP_ACCEPT &&
2823                     last_lop_op != OP_PIPE_OP &&
2824                     last_lop_op != OP_SOCKPAIR)
2825                 {
2826                     warn(
2827                      "Bareword \"%s\" not allowed while \"strict subs\" in use",
2828                         tokenbuf);
2829                     ++error_count;
2830                 }
2831
2832                 /* Call it a bare word */
2833
2834             bareword:
2835                 if (dowarn) {
2836                     if (lastchar != '-') {
2837                         for (d = tokenbuf; *d && isLOWER(*d); d++) ;
2838                         if (!*d)
2839                             warn(warn_reserved, tokenbuf);
2840                     }
2841                 }
2842                 if (lastchar && strchr("*%&", lastchar)) {
2843                     warn("Operator or semicolon missing before %c%s",
2844                         lastchar, tokenbuf);
2845                     warn("Ambiguous use of %c resolved as operator %c",
2846                         lastchar, lastchar);
2847                 }
2848                 TOKEN(WORD);
2849             }
2850
2851         case KEY___FILE__:
2852             yylval.opval = (OP*)newSVOP(OP_CONST, 0,
2853                                         newSVsv(GvSV(curcop->cop_filegv)));
2854             TERM(THING);
2855
2856         case KEY___LINE__:
2857             yylval.opval = (OP*)newSVOP(OP_CONST, 0,
2858                                     newSVpvf("%ld", (long)curcop->cop_line));
2859             TERM(THING);
2860
2861         case KEY___PACKAGE__:
2862             yylval.opval = (OP*)newSVOP(OP_CONST, 0,
2863                                         (curstash
2864                                          ? newSVsv(curstname)
2865                                          : &sv_undef));
2866             TERM(THING);
2867
2868         case KEY___DATA__:
2869         case KEY___END__: {
2870             GV *gv;
2871
2872             /*SUPPRESS 560*/
2873             if (rsfp && (!in_eval || tokenbuf[2] == 'D')) {
2874                 char *pname = "main";
2875                 if (tokenbuf[2] == 'D')
2876                     pname = HvNAME(curstash ? curstash : defstash);
2877                 gv = gv_fetchpv(form("%s::DATA", pname), TRUE, SVt_PVIO);
2878                 GvMULTI_on(gv);
2879                 if (!GvIO(gv))
2880                     GvIOp(gv) = newIO();
2881                 IoIFP(GvIOp(gv)) = rsfp;
2882 #if defined(HAS_FCNTL) && defined(F_SETFD)
2883                 {
2884                     int fd = PerlIO_fileno(rsfp);
2885                     fcntl(fd,F_SETFD,fd >= 3);
2886                 }
2887 #endif
2888                 /* Mark this internal pseudo-handle as clean */
2889                 IoFLAGS(GvIOp(gv)) |= IOf_UNTAINT;
2890                 if (preprocess)
2891                     IoTYPE(GvIOp(gv)) = '|';
2892                 else if ((PerlIO*)rsfp == PerlIO_stdin())
2893                     IoTYPE(GvIOp(gv)) = '-';
2894                 else
2895                     IoTYPE(GvIOp(gv)) = '<';
2896                 rsfp = Nullfp;
2897             }
2898             goto fake_eof;
2899         }
2900
2901         case KEY_AUTOLOAD:
2902         case KEY_DESTROY:
2903         case KEY_BEGIN:
2904         case KEY_END:
2905         case KEY_INIT:
2906             if (expect == XSTATE) {
2907                 s = bufptr;
2908                 goto really_sub;
2909             }
2910             goto just_a_word;
2911
2912         case KEY_CORE:
2913             if (*s == ':' && s[1] == ':') {
2914                 s += 2;
2915                 d = s;
2916                 s = scan_word(s, tokenbuf, sizeof tokenbuf, FALSE, &len);
2917                 tmp = keyword(tokenbuf, len);
2918                 if (tmp < 0)
2919                     tmp = -tmp;
2920                 goto reserved_word;
2921             }
2922             goto just_a_word;
2923
2924         case KEY_abs:
2925             UNI(OP_ABS);
2926
2927         case KEY_alarm:
2928             UNI(OP_ALARM);
2929
2930         case KEY_accept:
2931             LOP(OP_ACCEPT,XTERM);
2932
2933         case KEY_and:
2934             OPERATOR(ANDOP);
2935
2936         case KEY_atan2:
2937             LOP(OP_ATAN2,XTERM);
2938
2939         case KEY_bind:
2940             LOP(OP_BIND,XTERM);
2941
2942         case KEY_binmode:
2943             UNI(OP_BINMODE);
2944
2945         case KEY_bless:
2946             LOP(OP_BLESS,XTERM);
2947
2948         case KEY_chop:
2949             UNI(OP_CHOP);
2950
2951         case KEY_continue:
2952             PREBLOCK(CONTINUE);
2953
2954         case KEY_chdir:
2955             (void)gv_fetchpv("ENV",TRUE, SVt_PVHV);     /* may use HOME */
2956             UNI(OP_CHDIR);
2957
2958         case KEY_close:
2959             UNI(OP_CLOSE);
2960
2961         case KEY_closedir:
2962             UNI(OP_CLOSEDIR);
2963
2964         case KEY_cmp:
2965             Eop(OP_SCMP);
2966
2967         case KEY_caller:
2968             UNI(OP_CALLER);
2969
2970         case KEY_crypt:
2971 #ifdef FCRYPT
2972             if (!cryptseen++)
2973                 init_des();
2974 #endif
2975             LOP(OP_CRYPT,XTERM);
2976
2977         case KEY_chmod:
2978             if (dowarn) {
2979                 for (d = s; d < bufend && (isSPACE(*d) || *d == '('); d++) ;
2980                 if (*d != '0' && isDIGIT(*d))
2981                     yywarn("chmod: mode argument is missing initial 0");
2982             }
2983             LOP(OP_CHMOD,XTERM);
2984
2985         case KEY_chown:
2986             LOP(OP_CHOWN,XTERM);
2987
2988         case KEY_connect:
2989             LOP(OP_CONNECT,XTERM);
2990
2991         case KEY_chr:
2992             UNI(OP_CHR);
2993
2994         case KEY_cos:
2995             UNI(OP_COS);
2996
2997         case KEY_chroot:
2998             UNI(OP_CHROOT);
2999
3000         case KEY_do:
3001             s = skipspace(s);
3002             if (*s == '{')
3003                 PRETERMBLOCK(DO);
3004             if (*s != '\'')
3005                 s = force_word(s,WORD,FALSE,TRUE,FALSE);
3006             OPERATOR(DO);
3007
3008         case KEY_die:
3009             hints |= HINT_BLOCK_SCOPE;
3010             LOP(OP_DIE,XTERM);
3011
3012         case KEY_defined:
3013             UNI(OP_DEFINED);
3014
3015         case KEY_delete:
3016             UNI(OP_DELETE);
3017
3018         case KEY_dbmopen:
3019             gv_fetchpv("AnyDBM_File::ISA", GV_ADDMULTI, SVt_PVAV);
3020             LOP(OP_DBMOPEN,XTERM);
3021
3022         case KEY_dbmclose:
3023             UNI(OP_DBMCLOSE);
3024
3025         case KEY_dump:
3026             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3027             LOOPX(OP_DUMP);
3028
3029         case KEY_else:
3030             PREBLOCK(ELSE);
3031
3032         case KEY_elsif:
3033             yylval.ival = curcop->cop_line;
3034             OPERATOR(ELSIF);
3035
3036         case KEY_eq:
3037             Eop(OP_SEQ);
3038
3039         case KEY_exists:
3040             UNI(OP_EXISTS);
3041             
3042         case KEY_exit:
3043             UNI(OP_EXIT);
3044
3045         case KEY_eval:
3046             s = skipspace(s);
3047             expect = (*s == '{') ? XTERMBLOCK : XTERM;
3048             UNIBRACK(OP_ENTEREVAL);
3049
3050         case KEY_eof:
3051             UNI(OP_EOF);
3052
3053         case KEY_exp:
3054             UNI(OP_EXP);
3055
3056         case KEY_each:
3057             UNI(OP_EACH);
3058
3059         case KEY_exec:
3060             set_csh();
3061             LOP(OP_EXEC,XREF);
3062
3063         case KEY_endhostent:
3064             FUN0(OP_EHOSTENT);
3065
3066         case KEY_endnetent:
3067             FUN0(OP_ENETENT);
3068
3069         case KEY_endservent:
3070             FUN0(OP_ESERVENT);
3071
3072         case KEY_endprotoent:
3073             FUN0(OP_EPROTOENT);
3074
3075         case KEY_endpwent:
3076             FUN0(OP_EPWENT);
3077
3078         case KEY_endgrent:
3079             FUN0(OP_EGRENT);
3080
3081         case KEY_for:
3082         case KEY_foreach:
3083             yylval.ival = curcop->cop_line;
3084             s = skipspace(s);
3085             if (isIDFIRST(*s)) {
3086                 char *p = s;
3087                 if ((bufend - p) >= 3 &&
3088                     strnEQ(p, "my", 2) && isSPACE(*(p + 2)))
3089                     p += 2;
3090                 p = skipspace(p);
3091                 if (isIDFIRST(*p))
3092                     croak("Missing $ on loop variable");
3093             }
3094             OPERATOR(FOR);
3095
3096         case KEY_formline:
3097             LOP(OP_FORMLINE,XTERM);
3098
3099         case KEY_fork:
3100             FUN0(OP_FORK);
3101
3102         case KEY_fcntl:
3103             LOP(OP_FCNTL,XTERM);
3104
3105         case KEY_fileno:
3106             UNI(OP_FILENO);
3107
3108         case KEY_flock:
3109             LOP(OP_FLOCK,XTERM);
3110
3111         case KEY_gt:
3112             Rop(OP_SGT);
3113
3114         case KEY_ge:
3115             Rop(OP_SGE);
3116
3117         case KEY_grep:
3118             LOP(OP_GREPSTART, *s == '(' ? XTERM : XREF);
3119
3120         case KEY_goto:
3121             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3122             LOOPX(OP_GOTO);
3123
3124         case KEY_gmtime:
3125             UNI(OP_GMTIME);
3126
3127         case KEY_getc:
3128             UNI(OP_GETC);
3129
3130         case KEY_getppid:
3131             FUN0(OP_GETPPID);
3132
3133         case KEY_getpgrp:
3134             UNI(OP_GETPGRP);
3135
3136         case KEY_getpriority:
3137             LOP(OP_GETPRIORITY,XTERM);
3138
3139         case KEY_getprotobyname:
3140             UNI(OP_GPBYNAME);
3141
3142         case KEY_getprotobynumber:
3143             LOP(OP_GPBYNUMBER,XTERM);
3144
3145         case KEY_getprotoent:
3146             FUN0(OP_GPROTOENT);
3147
3148         case KEY_getpwent:
3149             FUN0(OP_GPWENT);
3150
3151         case KEY_getpwnam:
3152             UNI(OP_GPWNAM);
3153
3154         case KEY_getpwuid:
3155             UNI(OP_GPWUID);
3156
3157         case KEY_getpeername:
3158             UNI(OP_GETPEERNAME);
3159
3160         case KEY_gethostbyname:
3161             UNI(OP_GHBYNAME);
3162
3163         case KEY_gethostbyaddr:
3164             LOP(OP_GHBYADDR,XTERM);
3165
3166         case KEY_gethostent:
3167             FUN0(OP_GHOSTENT);
3168
3169         case KEY_getnetbyname:
3170             UNI(OP_GNBYNAME);
3171
3172         case KEY_getnetbyaddr:
3173             LOP(OP_GNBYADDR,XTERM);
3174
3175         case KEY_getnetent:
3176             FUN0(OP_GNETENT);
3177
3178         case KEY_getservbyname:
3179             LOP(OP_GSBYNAME,XTERM);
3180
3181         case KEY_getservbyport:
3182             LOP(OP_GSBYPORT,XTERM);
3183
3184         case KEY_getservent:
3185             FUN0(OP_GSERVENT);
3186
3187         case KEY_getsockname:
3188             UNI(OP_GETSOCKNAME);
3189
3190         case KEY_getsockopt:
3191             LOP(OP_GSOCKOPT,XTERM);
3192
3193         case KEY_getgrent:
3194             FUN0(OP_GGRENT);
3195
3196         case KEY_getgrnam:
3197             UNI(OP_GGRNAM);
3198
3199         case KEY_getgrgid:
3200             UNI(OP_GGRGID);
3201
3202         case KEY_getlogin:
3203             FUN0(OP_GETLOGIN);
3204
3205         case KEY_glob:
3206             set_csh();
3207             LOP(OP_GLOB,XTERM);
3208
3209         case KEY_hex:
3210             UNI(OP_HEX);
3211
3212         case KEY_if:
3213             yylval.ival = curcop->cop_line;
3214             OPERATOR(IF);
3215
3216         case KEY_index:
3217             LOP(OP_INDEX,XTERM);
3218
3219         case KEY_int:
3220             UNI(OP_INT);
3221
3222         case KEY_ioctl:
3223             LOP(OP_IOCTL,XTERM);
3224
3225         case KEY_join:
3226             LOP(OP_JOIN,XTERM);
3227
3228         case KEY_keys:
3229             UNI(OP_KEYS);
3230
3231         case KEY_kill:
3232             LOP(OP_KILL,XTERM);
3233
3234         case KEY_last:
3235             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3236             LOOPX(OP_LAST);
3237             
3238         case KEY_lc:
3239             UNI(OP_LC);
3240
3241         case KEY_lcfirst:
3242             UNI(OP_LCFIRST);
3243
3244         case KEY_local:
3245             OPERATOR(LOCAL);
3246
3247         case KEY_length:
3248             UNI(OP_LENGTH);
3249
3250         case KEY_lt:
3251             Rop(OP_SLT);
3252
3253         case KEY_le:
3254             Rop(OP_SLE);
3255
3256         case KEY_localtime:
3257             UNI(OP_LOCALTIME);
3258
3259         case KEY_log:
3260             UNI(OP_LOG);
3261
3262         case KEY_link:
3263             LOP(OP_LINK,XTERM);
3264
3265         case KEY_listen:
3266             LOP(OP_LISTEN,XTERM);
3267
3268         case KEY_lock:
3269             UNI(OP_LOCK);
3270
3271         case KEY_lstat:
3272             UNI(OP_LSTAT);
3273
3274         case KEY_m:
3275             s = scan_pat(s);
3276             TERM(sublex_start());
3277
3278         case KEY_map:
3279             LOP(OP_MAPSTART,XREF);
3280             
3281         case KEY_mkdir:
3282             LOP(OP_MKDIR,XTERM);
3283
3284         case KEY_msgctl:
3285             LOP(OP_MSGCTL,XTERM);
3286
3287         case KEY_msgget:
3288             LOP(OP_MSGGET,XTERM);
3289
3290         case KEY_msgrcv:
3291             LOP(OP_MSGRCV,XTERM);
3292
3293         case KEY_msgsnd:
3294             LOP(OP_MSGSND,XTERM);
3295
3296         case KEY_my:
3297             in_my = TRUE;
3298             s = skipspace(s);
3299             if (isIDFIRST(*s)) {
3300                 s = scan_word(s, tokenbuf, sizeof tokenbuf, TRUE, &len);
3301                 in_my_stash = gv_stashpv(tokenbuf, FALSE);
3302                 if (!in_my_stash) {
3303                     char tmpbuf[1024];
3304                     bufptr = s;
3305                     sprintf(tmpbuf, "No such class %.1000s", tokenbuf);
3306                     yyerror(tmpbuf);
3307                 }
3308             }
3309             OPERATOR(MY);
3310
3311         case KEY_next:
3312             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3313             LOOPX(OP_NEXT);
3314
3315         case KEY_ne:
3316             Eop(OP_SNE);
3317
3318         case KEY_no:
3319             if (expect != XSTATE)
3320                 yyerror("\"no\" not allowed in expression");
3321             s = force_word(s,WORD,FALSE,TRUE,FALSE);
3322             s = force_version(s);
3323             yylval.ival = 0;
3324             OPERATOR(USE);
3325
3326         case KEY_not:
3327             OPERATOR(NOTOP);
3328
3329         case KEY_open:
3330             s = skipspace(s);
3331             if (isIDFIRST(*s)) {
3332                 char *t;
3333                 for (d = s; isALNUM(*d); d++) ;
3334                 t = skipspace(d);
3335                 if (strchr("|&*+-=!?:.", *t))
3336                     warn("Precedence problem: open %.*s should be open(%.*s)",
3337                         d-s,s, d-s,s);
3338             }
3339             LOP(OP_OPEN,XTERM);
3340
3341         case KEY_or:
3342             yylval.ival = OP_OR;
3343             OPERATOR(OROP);
3344
3345         case KEY_ord:
3346             UNI(OP_ORD);
3347
3348         case KEY_oct:
3349             UNI(OP_OCT);
3350
3351         case KEY_opendir:
3352             LOP(OP_OPEN_DIR,XTERM);
3353
3354         case KEY_print:
3355             checkcomma(s,tokenbuf,"filehandle");
3356             LOP(OP_PRINT,XREF);
3357
3358         case KEY_printf:
3359             checkcomma(s,tokenbuf,"filehandle");
3360             LOP(OP_PRTF,XREF);
3361
3362         case KEY_prototype:
3363             UNI(OP_PROTOTYPE);
3364
3365         case KEY_push:
3366             LOP(OP_PUSH,XTERM);
3367
3368         case KEY_pop:
3369             UNI(OP_POP);
3370
3371         case KEY_pos:
3372             UNI(OP_POS);
3373             
3374         case KEY_pack:
3375             LOP(OP_PACK,XTERM);
3376
3377         case KEY_package:
3378             s = force_word(s,WORD,FALSE,TRUE,FALSE);
3379             OPERATOR(PACKAGE);
3380
3381         case KEY_pipe:
3382             LOP(OP_PIPE_OP,XTERM);
3383
3384         case KEY_q:
3385             s = scan_str(s);
3386             if (!s)
3387                 missingterm((char*)0);
3388             yylval.ival = OP_CONST;
3389             TERM(sublex_start());
3390
3391         case KEY_quotemeta:
3392             UNI(OP_QUOTEMETA);
3393
3394         case KEY_qw:
3395             s = scan_str(s);
3396             if (!s)
3397                 missingterm((char*)0);
3398             if (dowarn && SvLEN(lex_stuff)) {
3399                 d = SvPV_force(lex_stuff, len);
3400                 for (; len; --len, ++d) {
3401                     if (*d == ',') {
3402                         warn("Possible attempt to separate words with commas");
3403                         break;
3404                     }
3405                     if (*d == '#') {
3406                         warn("Possible attempt to put comments in qw() list");
3407                         break;
3408                     }
3409                 }
3410             }
3411             force_next(')');
3412             nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, q(lex_stuff));
3413             lex_stuff = Nullsv;
3414             force_next(THING);
3415             force_next(',');
3416             nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(" ",1));
3417             force_next(THING);
3418             force_next('(');
3419             yylval.ival = OP_SPLIT;
3420             CLINE;
3421             expect = XTERM;
3422             bufptr = s;
3423             last_lop = oldbufptr;
3424             last_lop_op = OP_SPLIT;
3425             return FUNC;
3426
3427         case KEY_qq:
3428             s = scan_str(s);
3429             if (!s)
3430                 missingterm((char*)0);
3431             yylval.ival = OP_STRINGIFY;
3432             if (SvIVX(lex_stuff) == '\'')
3433                 SvIVX(lex_stuff) = 0;   /* qq'$foo' should intepolate */
3434             TERM(sublex_start());
3435
3436         case KEY_qx:
3437             s = scan_str(s);
3438             if (!s)
3439                 missingterm((char*)0);
3440             yylval.ival = OP_BACKTICK;
3441             set_csh();
3442             TERM(sublex_start());
3443
3444         case KEY_return:
3445             OLDLOP(OP_RETURN);
3446
3447         case KEY_require:
3448             *tokenbuf = '\0';
3449             s = force_word(s,WORD,TRUE,TRUE,FALSE);
3450             if (isIDFIRST(*tokenbuf))
3451                 gv_stashpvn(tokenbuf, strlen(tokenbuf), TRUE);
3452             else if (*s == '<')
3453                 yyerror("<> should be quotes");
3454             UNI(OP_REQUIRE);
3455
3456         case KEY_reset:
3457             UNI(OP_RESET);
3458
3459         case KEY_redo:
3460             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3461             LOOPX(OP_REDO);
3462
3463         case KEY_rename:
3464             LOP(OP_RENAME,XTERM);
3465
3466         case KEY_rand:
3467             UNI(OP_RAND);
3468
3469         case KEY_rmdir:
3470             UNI(OP_RMDIR);
3471
3472         case KEY_rindex:
3473             LOP(OP_RINDEX,XTERM);
3474
3475         case KEY_read:
3476             LOP(OP_READ,XTERM);
3477
3478         case KEY_readdir:
3479             UNI(OP_READDIR);
3480
3481         case KEY_readline:
3482             set_csh();
3483             UNI(OP_READLINE);
3484
3485         case KEY_readpipe:
3486             set_csh();
3487             UNI(OP_BACKTICK);
3488
3489         case KEY_rewinddir:
3490             UNI(OP_REWINDDIR);
3491
3492         case KEY_recv:
3493             LOP(OP_RECV,XTERM);
3494
3495         case KEY_reverse:
3496             LOP(OP_REVERSE,XTERM);
3497
3498         case KEY_readlink:
3499             UNI(OP_READLINK);
3500
3501         case KEY_ref:
3502             UNI(OP_REF);
3503
3504         case KEY_s:
3505             s = scan_subst(s);
3506             if (yylval.opval)
3507                 TERM(sublex_start());
3508             else
3509                 TOKEN(1);       /* force error */
3510
3511         case KEY_chomp:
3512             UNI(OP_CHOMP);
3513             
3514         case KEY_scalar:
3515             UNI(OP_SCALAR);
3516
3517         case KEY_select:
3518             LOP(OP_SELECT,XTERM);
3519
3520         case KEY_seek:
3521             LOP(OP_SEEK,XTERM);
3522
3523         case KEY_semctl:
3524             LOP(OP_SEMCTL,XTERM);
3525
3526         case KEY_semget:
3527             LOP(OP_SEMGET,XTERM);
3528
3529         case KEY_semop:
3530             LOP(OP_SEMOP,XTERM);
3531
3532         case KEY_send:
3533             LOP(OP_SEND,XTERM);
3534
3535         case KEY_setpgrp:
3536             LOP(OP_SETPGRP,XTERM);
3537
3538         case KEY_setpriority:
3539             LOP(OP_SETPRIORITY,XTERM);
3540
3541         case KEY_sethostent:
3542             UNI(OP_SHOSTENT);
3543
3544         case KEY_setnetent:
3545             UNI(OP_SNETENT);
3546
3547         case KEY_setservent:
3548             UNI(OP_SSERVENT);
3549
3550         case KEY_setprotoent:
3551             UNI(OP_SPROTOENT);
3552
3553         case KEY_setpwent:
3554             FUN0(OP_SPWENT);
3555
3556         case KEY_setgrent:
3557             FUN0(OP_SGRENT);
3558
3559         case KEY_seekdir:
3560             LOP(OP_SEEKDIR,XTERM);
3561
3562         case KEY_setsockopt:
3563             LOP(OP_SSOCKOPT,XTERM);
3564
3565         case KEY_shift:
3566             UNI(OP_SHIFT);
3567
3568         case KEY_shmctl:
3569             LOP(OP_SHMCTL,XTERM);
3570
3571         case KEY_shmget:
3572             LOP(OP_SHMGET,XTERM);
3573
3574         case KEY_shmread:
3575             LOP(OP_SHMREAD,XTERM);
3576
3577         case KEY_shmwrite:
3578             LOP(OP_SHMWRITE,XTERM);
3579
3580         case KEY_shutdown:
3581             LOP(OP_SHUTDOWN,XTERM);
3582
3583         case KEY_sin:
3584             UNI(OP_SIN);
3585
3586         case KEY_sleep:
3587             UNI(OP_SLEEP);
3588
3589         case KEY_socket:
3590             LOP(OP_SOCKET,XTERM);
3591
3592         case KEY_socketpair:
3593             LOP(OP_SOCKPAIR,XTERM);
3594
3595         case KEY_sort:
3596             checkcomma(s,tokenbuf,"subroutine name");
3597             s = skipspace(s);
3598             if (*s == ';' || *s == ')')         /* probably a close */
3599                 croak("sort is now a reserved word");
3600             expect = XTERM;
3601             s = force_word(s,WORD,TRUE,TRUE,FALSE);
3602             LOP(OP_SORT,XREF);
3603
3604         case KEY_split:
3605             LOP(OP_SPLIT,XTERM);
3606
3607         case KEY_sprintf:
3608             LOP(OP_SPRINTF,XTERM);
3609
3610         case KEY_splice:
3611             LOP(OP_SPLICE,XTERM);
3612
3613         case KEY_sqrt:
3614             UNI(OP_SQRT);
3615
3616         case KEY_srand:
3617             UNI(OP_SRAND);
3618
3619         case KEY_stat:
3620             UNI(OP_STAT);
3621
3622         case KEY_study:
3623             sawstudy++;
3624             UNI(OP_STUDY);
3625
3626         case KEY_substr:
3627             LOP(OP_SUBSTR,XTERM);
3628
3629         case KEY_format:
3630         case KEY_sub:
3631           really_sub:
3632             s = skipspace(s);
3633
3634             if (isIDFIRST(*s) || *s == '\'' || *s == ':') {
3635                 char tmpbuf[sizeof tokenbuf];
3636                 expect = XBLOCK;
3637                 d = scan_word(s, tmpbuf, sizeof tmpbuf, TRUE, &len);
3638                 if (strchr(tmpbuf, ':'))
3639                     sv_setpv(subname, tmpbuf);
3640                 else {
3641                     sv_setsv(subname,curstname);
3642                     sv_catpvn(subname,"::",2);
3643                     sv_catpvn(subname,tmpbuf,len);
3644                 }
3645                 s = force_word(s,WORD,FALSE,TRUE,TRUE);
3646                 s = skipspace(s);
3647             }
3648             else {
3649                 expect = XTERMBLOCK;
3650                 sv_setpv(subname,"?");
3651             }
3652
3653             if (tmp == KEY_format) {
3654                 s = skipspace(s);
3655                 if (*s == '=')
3656                     lex_formbrack = lex_brackets + 1;
3657                 OPERATOR(FORMAT);
3658             }
3659
3660             /* Look for a prototype */
3661             if (*s == '(') {
3662                 char *p;
3663
3664                 s = scan_str(s);
3665                 if (!s) {
3666                     if (lex_stuff)
3667                         SvREFCNT_dec(lex_stuff);
3668                     lex_stuff = Nullsv;
3669                     croak("Prototype not terminated");
3670                 }
3671                 /* strip spaces */
3672                 d = SvPVX(lex_stuff);
3673                 tmp = 0;
3674                 for (p = d; *p; ++p) {
3675                     if (!isSPACE(*p))
3676                         d[tmp++] = *p;
3677                 }
3678                 d[tmp] = '\0';
3679                 SvCUR(lex_stuff) = tmp;
3680
3681                 nexttoke++;
3682                 nextval[1] = nextval[0];
3683                 nexttype[1] = nexttype[0];
3684                 nextval[0].opval = (OP*)newSVOP(OP_CONST, 0, lex_stuff);
3685                 nexttype[0] = THING;
3686                 if (nexttoke == 1) {
3687                     lex_defer = lex_state;
3688                     lex_expect = expect;
3689                     lex_state = LEX_KNOWNEXT;
3690                 }
3691                 lex_stuff = Nullsv;
3692             }
3693
3694             if (*SvPV(subname,na) == '?') {
3695                 sv_setpv(subname,"__ANON__");
3696                 TOKEN(ANONSUB);
3697             }
3698             PREBLOCK(SUB);
3699
3700         case KEY_system:
3701             set_csh();
3702             LOP(OP_SYSTEM,XREF);
3703
3704         case KEY_symlink:
3705             LOP(OP_SYMLINK,XTERM);
3706
3707         case KEY_syscall:
3708             LOP(OP_SYSCALL,XTERM);
3709
3710         case KEY_sysopen:
3711             LOP(OP_SYSOPEN,XTERM);
3712
3713         case KEY_sysseek:
3714             LOP(OP_SYSSEEK,XTERM);
3715
3716         case KEY_sysread:
3717             LOP(OP_SYSREAD,XTERM);
3718
3719         case KEY_syswrite:
3720             LOP(OP_SYSWRITE,XTERM);
3721
3722         case KEY_tr:
3723             s = scan_trans(s);
3724             TERM(sublex_start());
3725
3726         case KEY_tell:
3727             UNI(OP_TELL);
3728
3729         case KEY_telldir:
3730             UNI(OP_TELLDIR);
3731
3732         case KEY_tie:
3733             LOP(OP_TIE,XTERM);
3734
3735         case KEY_tied:
3736             UNI(OP_TIED);
3737
3738         case KEY_time:
3739             FUN0(OP_TIME);
3740
3741         case KEY_times:
3742             FUN0(OP_TMS);
3743
3744         case KEY_truncate:
3745             LOP(OP_TRUNCATE,XTERM);
3746
3747         case KEY_uc:
3748             UNI(OP_UC);
3749
3750         case KEY_ucfirst:
3751             UNI(OP_UCFIRST);
3752
3753         case KEY_untie:
3754             UNI(OP_UNTIE);
3755
3756         case KEY_until:
3757             yylval.ival = curcop->cop_line;
3758             OPERATOR(UNTIL);
3759
3760         case KEY_unless:
3761             yylval.ival = curcop->cop_line;
3762             OPERATOR(UNLESS);
3763
3764         case KEY_unlink:
3765             LOP(OP_UNLINK,XTERM);
3766
3767         case KEY_undef:
3768             UNI(OP_UNDEF);
3769
3770         case KEY_unpack:
3771             LOP(OP_UNPACK,XTERM);
3772
3773         case KEY_utime:
3774             LOP(OP_UTIME,XTERM);
3775
3776         case KEY_umask:
3777             if (dowarn) {
3778                 for (d = s; d < bufend && (isSPACE(*d) || *d == '('); d++) ;
3779                 if (*d != '0' && isDIGIT(*d))
3780                     yywarn("umask: argument is missing initial 0");
3781             }
3782             UNI(OP_UMASK);
3783
3784         case KEY_unshift:
3785             LOP(OP_UNSHIFT,XTERM);
3786
3787         case KEY_use:
3788             if (expect != XSTATE)
3789                 yyerror("\"use\" not allowed in expression");
3790             s = skipspace(s);
3791             if(isDIGIT(*s)) {
3792                 s = force_version(s);
3793                 if(*s == ';' || (s = skipspace(s), *s == ';')) {
3794                     nextval[nexttoke].opval = Nullop;
3795                     force_next(WORD);
3796                 }
3797             }
3798             else {
3799                 s = force_word(s,WORD,FALSE,TRUE,FALSE);
3800                 s = force_version(s);
3801             }
3802             yylval.ival = 1;
3803             OPERATOR(USE);
3804
3805         case KEY_values:
3806             UNI(OP_VALUES);
3807
3808         case KEY_vec:
3809             sawvec = TRUE;
3810             LOP(OP_VEC,XTERM);
3811
3812         case KEY_while:
3813             yylval.ival = curcop->cop_line;
3814             OPERATOR(WHILE);
3815
3816         case KEY_warn:
3817             hints |= HINT_BLOCK_SCOPE;
3818             LOP(OP_WARN,XTERM);
3819
3820         case KEY_wait:
3821             FUN0(OP_WAIT);
3822
3823         case KEY_waitpid:
3824             LOP(OP_WAITPID,XTERM);
3825
3826         case KEY_wantarray:
3827             FUN0(OP_WANTARRAY);
3828
3829         case KEY_write:
3830             gv_fetchpv("\f",TRUE, SVt_PV);      /* Make sure $^L is defined */
3831             UNI(OP_ENTERWRITE);
3832
3833         case KEY_x:
3834             if (expect == XOPERATOR)
3835                 Mop(OP_REPEAT);
3836             check_uni();
3837             goto just_a_word;
3838
3839         case KEY_xor:
3840             yylval.ival = OP_XOR;
3841             OPERATOR(OROP);
3842
3843         case KEY_y:
3844             s = scan_trans(s);
3845             TERM(sublex_start());
3846         }
3847     }}
3848 }
3849
3850 I32
3851 keyword(register char *d, I32 len)
3852 {
3853     switch (*d) {
3854     case '_':
3855         if (d[1] == '_') {
3856             if (strEQ(d,"__FILE__"))            return -KEY___FILE__;
3857             if (strEQ(d,"__LINE__"))            return -KEY___LINE__;
3858             if (strEQ(d,"__PACKAGE__"))         return -KEY___PACKAGE__;
3859             if (strEQ(d,"__DATA__"))            return KEY___DATA__;
3860             if (strEQ(d,"__END__"))             return KEY___END__;
3861         }
3862         break;
3863     case 'A':
3864         if (strEQ(d,"AUTOLOAD"))                return KEY_AUTOLOAD;
3865         break;
3866     case 'a':
3867         switch (len) {
3868         case 3:
3869             if (strEQ(d,"and"))                 return -KEY_and;
3870             if (strEQ(d,"abs"))                 return -KEY_abs;
3871             break;
3872         case 5:
3873             if (strEQ(d,"alarm"))               return -KEY_alarm;
3874             if (strEQ(d,"atan2"))               return -KEY_atan2;
3875             break;
3876         case 6:
3877             if (strEQ(d,"accept"))              return -KEY_accept;
3878             break;
3879         }
3880         break;
3881     case 'B':
3882         if (strEQ(d,"BEGIN"))                   return KEY_BEGIN;
3883         break;
3884     case 'b':
3885         if (strEQ(d,"bless"))                   return -KEY_bless;
3886         if (strEQ(d,"bind"))                    return -KEY_bind;
3887         if (strEQ(d,"binmode"))                 return -KEY_binmode;
3888         break;
3889     case 'C':
3890         if (strEQ(d,"CORE"))                    return -KEY_CORE;
3891         break;
3892     case 'c':
3893         switch (len) {
3894         case 3:
3895             if (strEQ(d,"cmp"))                 return -KEY_cmp;
3896             if (strEQ(d,"chr"))                 return -KEY_chr;
3897             if (strEQ(d,"cos"))                 return -KEY_cos;
3898             break;
3899         case 4:
3900             if (strEQ(d,"chop"))                return KEY_chop;
3901             break;
3902         case 5:
3903             if (strEQ(d,"close"))               return -KEY_close;
3904             if (strEQ(d,"chdir"))               return -KEY_chdir;
3905             if (strEQ(d,"chomp"))               return KEY_chomp;
3906             if (strEQ(d,"chmod"))               return -KEY_chmod;
3907             if (strEQ(d,"chown"))               return -KEY_chown;
3908             if (strEQ(d,"crypt"))               return -KEY_crypt;
3909             break;
3910         case 6:
3911             if (strEQ(d,"chroot"))              return -KEY_chroot;
3912             if (strEQ(d,"caller"))              return -KEY_caller;
3913             break;
3914         case 7:
3915             if (strEQ(d,"connect"))             return -KEY_connect;
3916             break;
3917         case 8:
3918             if (strEQ(d,"closedir"))            return -KEY_closedir;
3919             if (strEQ(d,"continue"))            return -KEY_continue;
3920             break;
3921         }
3922         break;
3923     case 'D':
3924         if (strEQ(d,"DESTROY"))                 return KEY_DESTROY;
3925         break;
3926     case 'd':
3927         switch (len) {
3928         case 2:
3929             if (strEQ(d,"do"))                  return KEY_do;
3930             break;
3931         case 3:
3932             if (strEQ(d,"die"))                 return -KEY_die;
3933             break;
3934         case 4:
3935             if (strEQ(d,"dump"))                return -KEY_dump;
3936             break;
3937         case 6:
3938             if (strEQ(d,"delete"))              return KEY_delete;
3939             break;
3940         case 7:
3941             if (strEQ(d,"defined"))             return KEY_defined;
3942             if (strEQ(d,"dbmopen"))             return -KEY_dbmopen;
3943             break;
3944         case 8:
3945             if (strEQ(d,"dbmclose"))            return -KEY_dbmclose;
3946             break;
3947         }
3948         break;
3949     case 'E':
3950         if (strEQ(d,"EQ")) { deprecate(d);      return -KEY_eq;}
3951         if (strEQ(d,"END"))                     return KEY_END;
3952         break;
3953     case 'e':
3954         switch (len) {
3955         case 2:
3956             if (strEQ(d,"eq"))                  return -KEY_eq;
3957             break;
3958         case 3:
3959             if (strEQ(d,"eof"))                 return -KEY_eof;
3960             if (strEQ(d,"exp"))                 return -KEY_exp;
3961             break;
3962         case 4:
3963             if (strEQ(d,"else"))                return KEY_else;
3964             if (strEQ(d,"exit"))                return -KEY_exit;
3965             if (strEQ(d,"eval"))                return KEY_eval;
3966             if (strEQ(d,"exec"))                return -KEY_exec;
3967             if (strEQ(d,"each"))                return KEY_each;
3968             break;
3969         case 5:
3970             if (strEQ(d,"elsif"))               return KEY_elsif;
3971             break;
3972         case 6:
3973             if (strEQ(d,"exists"))              return KEY_exists;
3974             if (strEQ(d,"elseif")) warn("elseif should be elsif");
3975             break;
3976         case 8:
3977             if (strEQ(d,"endgrent"))            return -KEY_endgrent;
3978             if (strEQ(d,"endpwent"))            return -KEY_endpwent;
3979             break;
3980         case 9:
3981             if (strEQ(d,"endnetent"))           return -KEY_endnetent;
3982             break;
3983         case 10:
3984             if (strEQ(d,"endhostent"))          return -KEY_endhostent;
3985             if (strEQ(d,"endservent"))          return -KEY_endservent;
3986             break;
3987         case 11:
3988             if (strEQ(d,"endprotoent"))         return -KEY_endprotoent;
3989             break;
3990         }
3991         break;
3992     case 'f':
3993         switch (len) {
3994         case 3:
3995             if (strEQ(d,"for"))                 return KEY_for;
3996             break;
3997         case 4:
3998             if (strEQ(d,"fork"))                return -KEY_fork;
3999             break;
4000         case 5:
4001             if (strEQ(d,"fcntl"))               return -KEY_fcntl;
4002             if (strEQ(d,"flock"))               return -KEY_flock;
4003             break;
4004         case 6:
4005             if (strEQ(d,"format"))              return KEY_format;
4006             if (strEQ(d,"fileno"))              return -KEY_fileno;
4007             break;
4008         case 7:
4009             if (strEQ(d,"foreach"))             return KEY_foreach;
4010             break;
4011         case 8:
4012             if (strEQ(d,"formline"))            return -KEY_formline;
4013             break;
4014         }
4015         break;
4016     case 'G':
4017         if (len == 2) {
4018             if (strEQ(d,"GT")) { deprecate(d);  return -KEY_gt;}
4019             if (strEQ(d,"GE")) { deprecate(d);  return -KEY_ge;}
4020         }
4021         break;
4022     case 'g':
4023         if (strnEQ(d,"get",3)) {
4024             d += 3;
4025             if (*d == 'p') {
4026                 switch (len) {
4027                 case 7:
4028                     if (strEQ(d,"ppid"))        return -KEY_getppid;
4029                     if (strEQ(d,"pgrp"))        return -KEY_getpgrp;
4030                     break;
4031                 case 8:
4032                     if (strEQ(d,"pwent"))       return -KEY_getpwent;
4033                     if (strEQ(d,"pwnam"))       return -KEY_getpwnam;
4034                     if (strEQ(d,"pwuid"))       return -KEY_getpwuid;
4035                     break;
4036                 case 11:
4037                     if (strEQ(d,"peername"))    return -KEY_getpeername;
4038                     if (strEQ(d,"protoent"))    return -KEY_getprotoent;
4039                     if (strEQ(d,"priority"))    return -KEY_getpriority;
4040                     break;
4041                 case 14:
4042                     if (strEQ(d,"protobyname")) return -KEY_getprotobyname;
4043                     break;
4044                 case 16:
4045                     if (strEQ(d,"protobynumber"))return -KEY_getprotobynumber;
4046                     break;
4047                 }
4048             }
4049             else if (*d == 'h') {
4050                 if (strEQ(d,"hostbyname"))      return -KEY_gethostbyname;
4051                 if (strEQ(d,"hostbyaddr"))      return -KEY_gethostbyaddr;
4052                 if (strEQ(d,"hostent"))         return -KEY_gethostent;
4053             }
4054             else if (*d == 'n') {
4055                 if (strEQ(d,"netbyname"))       return -KEY_getnetbyname;
4056                 if (strEQ(d,"netbyaddr"))       return -KEY_getnetbyaddr;
4057                 if (strEQ(d,"netent"))          return -KEY_getnetent;
4058             }
4059             else if (*d == 's') {
4060                 if (strEQ(d,"servbyname"))      return -KEY_getservbyname;
4061                 if (strEQ(d,"servbyport"))      return -KEY_getservbyport;
4062                 if (strEQ(d,"servent"))         return -KEY_getservent;
4063                 if (strEQ(d,"sockname"))        return -KEY_getsockname;
4064                 if (strEQ(d,"sockopt"))         return -KEY_getsockopt;
4065             }
4066             else if (*d == 'g') {
4067                 if (strEQ(d,"grent"))           return -KEY_getgrent;
4068                 if (strEQ(d,"grnam"))           return -KEY_getgrnam;
4069                 if (strEQ(d,"grgid"))           return -KEY_getgrgid;
4070             }
4071             else if (*d == 'l') {
4072                 if (strEQ(d,"login"))           return -KEY_getlogin;
4073             }
4074             else if (strEQ(d,"c"))              return -KEY_getc;
4075             break;
4076         }
4077         switch (len) {
4078         case 2:
4079             if (strEQ(d,"gt"))                  return -KEY_gt;
4080             if (strEQ(d,"ge"))                  return -KEY_ge;
4081             break;
4082         case 4:
4083             if (strEQ(d,"grep"))                return KEY_grep;
4084             if (strEQ(d,"goto"))                return KEY_goto;
4085             if (strEQ(d,"glob"))                return KEY_glob;
4086             break;
4087         case 6:
4088             if (strEQ(d,"gmtime"))              return -KEY_gmtime;
4089             break;
4090         }
4091         break;
4092     case 'h':
4093         if (strEQ(d,"hex"))                     return -KEY_hex;
4094         break;
4095     case 'I':
4096         if (strEQ(d,"INIT"))                    return KEY_INIT;
4097         break;
4098     case 'i':
4099         switch (len) {
4100         case 2:
4101             if (strEQ(d,"if"))                  return KEY_if;
4102             break;
4103         case 3:
4104             if (strEQ(d,"int"))                 return -KEY_int;
4105             break;
4106         case 5:
4107             if (strEQ(d,"index"))               return -KEY_index;
4108             if (strEQ(d,"ioctl"))               return -KEY_ioctl;
4109             break;
4110         }
4111         break;
4112     case 'j':
4113         if (strEQ(d,"join"))                    return -KEY_join;
4114         break;
4115     case 'k':
4116         if (len == 4) {
4117             if (strEQ(d,"keys"))                return KEY_keys;
4118             if (strEQ(d,"kill"))                return -KEY_kill;
4119         }
4120         break;
4121     case 'L':
4122         if (len == 2) {
4123             if (strEQ(d,"LT")) { deprecate(d);  return -KEY_lt;}
4124             if (strEQ(d,"LE")) { deprecate(d);  return -KEY_le;}
4125         }
4126         break;
4127     case 'l':
4128         switch (len) {
4129         case 2:
4130             if (strEQ(d,"lt"))                  return -KEY_lt;
4131             if (strEQ(d,"le"))                  return -KEY_le;
4132             if (strEQ(d,"lc"))                  return -KEY_lc;
4133             break;
4134         case 3:
4135             if (strEQ(d,"log"))                 return -KEY_log;
4136             break;
4137         case 4:
4138             if (strEQ(d,"last"))                return KEY_last;
4139             if (strEQ(d,"link"))                return -KEY_link;
4140             if (strEQ(d,"lock"))                return -KEY_lock;
4141             break;
4142         case 5:
4143             if (strEQ(d,"local"))               return KEY_local;
4144             if (strEQ(d,"lstat"))               return -KEY_lstat;
4145             break;
4146         case 6:
4147             if (strEQ(d,"length"))              return -KEY_length;
4148             if (strEQ(d,"listen"))              return -KEY_listen;
4149             break;
4150         case 7:
4151             if (strEQ(d,"lcfirst"))             return -KEY_lcfirst;
4152             break;
4153         case 9:
4154             if (strEQ(d,"localtime"))           return -KEY_localtime;
4155             break;
4156         }
4157         break;
4158     case 'm':
4159         switch (len) {
4160         case 1:                                 return KEY_m;
4161         case 2:
4162             if (strEQ(d,"my"))                  return KEY_my;
4163             break;
4164         case 3:
4165             if (strEQ(d,"map"))                 return KEY_map;
4166             break;
4167         case 5:
4168             if (strEQ(d,"mkdir"))               return -KEY_mkdir;
4169             break;
4170         case 6:
4171             if (strEQ(d,"msgctl"))              return -KEY_msgctl;
4172             if (strEQ(d,"msgget"))              return -KEY_msgget;
4173             if (strEQ(d,"msgrcv"))              return -KEY_msgrcv;
4174             if (strEQ(d,"msgsnd"))              return -KEY_msgsnd;
4175             break;
4176         }
4177         break;
4178     case 'N':
4179         if (strEQ(d,"NE")) { deprecate(d);      return -KEY_ne;}
4180         break;
4181     case 'n':
4182         if (strEQ(d,"next"))                    return KEY_next;
4183         if (strEQ(d,"ne"))                      return -KEY_ne;
4184         if (strEQ(d,"not"))                     return -KEY_not;
4185         if (strEQ(d,"no"))                      return KEY_no;
4186         break;
4187     case 'o':
4188         switch (len) {
4189         case 2:
4190             if (strEQ(d,"or"))                  return -KEY_or;
4191             break;
4192         case 3:
4193             if (strEQ(d,"ord"))                 return -KEY_ord;
4194             if (strEQ(d,"oct"))                 return -KEY_oct;
4195             break;
4196         case 4:
4197             if (strEQ(d,"open"))                return -KEY_open;
4198             break;
4199         case 7:
4200             if (strEQ(d,"opendir"))             return -KEY_opendir;
4201             break;
4202         }
4203         break;
4204     case 'p':
4205         switch (len) {
4206         case 3:
4207             if (strEQ(d,"pop"))                 return KEY_pop;
4208             if (strEQ(d,"pos"))                 return KEY_pos;
4209             break;
4210         case 4:
4211             if (strEQ(d,"push"))                return KEY_push;
4212             if (strEQ(d,"pack"))                return -KEY_pack;
4213             if (strEQ(d,"pipe"))                return -KEY_pipe;
4214             break;
4215         case 5:
4216             if (strEQ(d,"print"))               return KEY_print;
4217             break;
4218         case 6:
4219             if (strEQ(d,"printf"))              return KEY_printf;
4220             break;
4221         case 7:
4222             if (strEQ(d,"package"))             return KEY_package;
4223             break;
4224         case 9:
4225             if (strEQ(d,"prototype"))           return KEY_prototype;
4226         }
4227         break;
4228     case 'q':
4229         if (len <= 2) {
4230             if (strEQ(d,"q"))                   return KEY_q;
4231             if (strEQ(d,"qq"))                  return KEY_qq;
4232             if (strEQ(d,"qw"))                  return KEY_qw;
4233             if (strEQ(d,"qx"))                  return KEY_qx;
4234         }
4235         else if (strEQ(d,"quotemeta"))          return -KEY_quotemeta;
4236         break;
4237     case 'r':
4238         switch (len) {
4239         case 3:
4240             if (strEQ(d,"ref"))                 return -KEY_ref;
4241             break;
4242         case 4:
4243             if (strEQ(d,"read"))                return -KEY_read;
4244             if (strEQ(d,"rand"))                return -KEY_rand;
4245             if (strEQ(d,"recv"))                return -KEY_recv;
4246             if (strEQ(d,"redo"))                return KEY_redo;
4247             break;
4248         case 5:
4249             if (strEQ(d,"rmdir"))               return -KEY_rmdir;
4250             if (strEQ(d,"reset"))               return -KEY_reset;
4251             break;
4252         case 6:
4253             if (strEQ(d,"return"))              return KEY_return;
4254             if (strEQ(d,"rename"))              return -KEY_rename;
4255             if (strEQ(d,"rindex"))              return -KEY_rindex;
4256             break;
4257         case 7:
4258             if (strEQ(d,"require"))             return -KEY_require;
4259             if (strEQ(d,"reverse"))             return -KEY_reverse;
4260             if (strEQ(d,"readdir"))             return -KEY_readdir;
4261             break;
4262         case 8:
4263             if (strEQ(d,"readlink"))            return -KEY_readlink;
4264             if (strEQ(d,"readline"))            return -KEY_readline;
4265             if (strEQ(d,"readpipe"))            return -KEY_readpipe;
4266             break;
4267         case 9:
4268             if (strEQ(d,"rewinddir"))           return -KEY_rewinddir;
4269             break;
4270         }
4271         break;
4272     case 's':
4273         switch (d[1]) {
4274         case 0:                                 return KEY_s;
4275         case 'c':
4276             if (strEQ(d,"scalar"))              return KEY_scalar;
4277             break;
4278         case 'e':
4279             switch (len) {
4280             case 4:
4281                 if (strEQ(d,"seek"))            return -KEY_seek;
4282                 if (strEQ(d,"send"))            return -KEY_send;
4283                 break;
4284             case 5:
4285                 if (strEQ(d,"semop"))           return -KEY_semop;
4286                 break;
4287             case 6:
4288                 if (strEQ(d,"select"))          return -KEY_select;
4289                 if (strEQ(d,"semctl"))          return -KEY_semctl;
4290                 if (strEQ(d,"semget"))          return -KEY_semget;
4291                 break;
4292             case 7:
4293                 if (strEQ(d,"setpgrp"))         return -KEY_setpgrp;
4294                 if (strEQ(d,"seekdir"))         return -KEY_seekdir;
4295                 break;
4296             case 8:
4297                 if (strEQ(d,"setpwent"))        return -KEY_setpwent;
4298                 if (strEQ(d,"setgrent"))        return -KEY_setgrent;
4299                 break;
4300             case 9:
4301                 if (strEQ(d,"setnetent"))       return -KEY_setnetent;
4302                 break;
4303             case 10:
4304                 if (strEQ(d,"setsockopt"))      return -KEY_setsockopt;
4305                 if (strEQ(d,"sethostent"))      return -KEY_sethostent;
4306                 if (strEQ(d,"setservent"))      return -KEY_setservent;
4307                 break;
4308             case 11:
4309                 if (strEQ(d,"setpriority"))     return -KEY_setpriority;
4310                 if (strEQ(d,"setprotoent"))     return -KEY_setprotoent;
4311                 break;
4312             }
4313             break;
4314         case 'h':
4315             switch (len) {
4316             case 5:
4317                 if (strEQ(d,"shift"))           return KEY_shift;
4318                 break;
4319             case 6:
4320                 if (strEQ(d,"shmctl"))          return -KEY_shmctl;
4321                 if (strEQ(d,"shmget"))          return -KEY_shmget;
4322                 break;
4323             case 7:
4324                 if (strEQ(d,"shmread"))         return -KEY_shmread;
4325                 break;
4326             case 8:
4327                 if (strEQ(d,"shmwrite"))        return -KEY_shmwrite;
4328                 if (strEQ(d,"shutdown"))        return -KEY_shutdown;
4329                 break;
4330             }
4331             break;
4332         case 'i':
4333             if (strEQ(d,"sin"))                 return -KEY_sin;
4334             break;
4335         case 'l':
4336             if (strEQ(d,"sleep"))               return -KEY_sleep;
4337             break;
4338         case 'o':
4339             if (strEQ(d,"sort"))                return KEY_sort;
4340             if (strEQ(d,"socket"))              return -KEY_socket;
4341             if (strEQ(d,"socketpair"))          return -KEY_socketpair;
4342             break;
4343         case 'p':
4344             if (strEQ(d,"split"))               return KEY_split;
4345             if (strEQ(d,"sprintf"))             return -KEY_sprintf;
4346             if (strEQ(d,"splice"))              return KEY_splice;
4347             break;
4348         case 'q':
4349             if (strEQ(d,"sqrt"))                return -KEY_sqrt;
4350             break;
4351         case 'r':
4352             if (strEQ(d,"srand"))               return -KEY_srand;
4353             break;
4354         case 't':
4355             if (strEQ(d,"stat"))                return -KEY_stat;
4356             if (strEQ(d,"study"))               return KEY_study;
4357             break;
4358         case 'u':
4359             if (strEQ(d,"substr"))              return -KEY_substr;
4360             if (strEQ(d,"sub"))                 return KEY_sub;
4361             break;
4362         case 'y':
4363             switch (len) {
4364             case 6:
4365                 if (strEQ(d,"system"))          return -KEY_system;
4366                 break;
4367             case 7:
4368                 if (strEQ(d,"symlink"))         return -KEY_symlink;
4369                 if (strEQ(d,"syscall"))         return -KEY_syscall;
4370                 if (strEQ(d,"sysopen"))         return -KEY_sysopen;
4371                 if (strEQ(d,"sysread"))         return -KEY_sysread;
4372                 if (strEQ(d,"sysseek"))         return -KEY_sysseek;
4373                 break;
4374             case 8:
4375                 if (strEQ(d,"syswrite"))        return -KEY_syswrite;
4376                 break;
4377             }
4378             break;
4379         }
4380         break;
4381     case 't':
4382         switch (len) {
4383         case 2:
4384             if (strEQ(d,"tr"))                  return KEY_tr;
4385             break;
4386         case 3:
4387             if (strEQ(d,"tie"))                 return KEY_tie;
4388             break;
4389         case 4:
4390             if (strEQ(d,"tell"))                return -KEY_tell;
4391             if (strEQ(d,"tied"))                return KEY_tied;
4392             if (strEQ(d,"time"))                return -KEY_time;
4393             break;
4394         case 5:
4395             if (strEQ(d,"times"))               return -KEY_times;
4396             break;
4397         case 7:
4398             if (strEQ(d,"telldir"))             return -KEY_telldir;
4399             break;
4400         case 8:
4401             if (strEQ(d,"truncate"))            return -KEY_truncate;
4402             break;
4403         }
4404         break;
4405     case 'u':
4406         switch (len) {
4407         case 2:
4408             if (strEQ(d,"uc"))                  return -KEY_uc;
4409             break;
4410         case 3:
4411             if (strEQ(d,"use"))                 return KEY_use;
4412             break;
4413         case 5:
4414             if (strEQ(d,"undef"))               return KEY_undef;
4415             if (strEQ(d,"until"))               return KEY_until;
4416             if (strEQ(d,"untie"))               return KEY_untie;
4417             if (strEQ(d,"utime"))               return -KEY_utime;
4418             if (strEQ(d,"umask"))               return -KEY_umask;
4419             break;
4420         case 6:
4421             if (strEQ(d,"unless"))              return KEY_unless;
4422             if (strEQ(d,"unpack"))              return -KEY_unpack;
4423             if (strEQ(d,"unlink"))              return -KEY_unlink;
4424             break;
4425         case 7:
4426             if (strEQ(d,"unshift"))             return KEY_unshift;
4427             if (strEQ(d,"ucfirst"))             return -KEY_ucfirst;
4428             break;
4429         }
4430         break;
4431     case 'v':
4432         if (strEQ(d,"values"))                  return -KEY_values;
4433         if (strEQ(d,"vec"))                     return -KEY_vec;
4434         break;
4435     case 'w':
4436         switch (len) {
4437         case 4:
4438             if (strEQ(d,"warn"))                return -KEY_warn;
4439             if (strEQ(d,"wait"))                return -KEY_wait;
4440             break;
4441         case 5:
4442             if (strEQ(d,"while"))               return KEY_while;
4443             if (strEQ(d,"write"))               return -KEY_write;
4444             break;
4445         case 7:
4446             if (strEQ(d,"waitpid"))             return -KEY_waitpid;
4447             break;
4448         case 9:
4449             if (strEQ(d,"wantarray"))           return -KEY_wantarray;
4450             break;
4451         }
4452         break;
4453     case 'x':
4454         if (len == 1)                           return -KEY_x;
4455         if (strEQ(d,"xor"))                     return -KEY_xor;
4456         break;
4457     case 'y':
4458         if (len == 1)                           return KEY_y;
4459         break;
4460     case 'z':
4461         break;
4462     }
4463     return 0;
4464 }
4465
4466 static void
4467 checkcomma(register char *s, char *name, char *what)
4468 {
4469     char *w;
4470
4471     if (dowarn && *s == ' ' && s[1] == '(') {   /* XXX gotta be a better way */
4472         int level = 1;
4473         for (w = s+2; *w && level; w++) {
4474             if (*w == '(')
4475                 ++level;
4476             else if (*w == ')')
4477                 --level;
4478         }
4479         if (*w)
4480             for (; *w && isSPACE(*w); w++) ;
4481         if (!*w || !strchr(";|})]oaiuw!=", *w)) /* an advisory hack only... */
4482             warn("%s (...) interpreted as function",name);
4483     }
4484     while (s < bufend && isSPACE(*s))
4485         s++;
4486     if (*s == '(')
4487         s++;
4488     while (s < bufend && isSPACE(*s))
4489         s++;
4490     if (isIDFIRST(*s)) {
4491         w = s++;
4492         while (isALNUM(*s))
4493             s++;
4494         while (s < bufend && isSPACE(*s))
4495             s++;
4496         if (*s == ',') {
4497             int kw;
4498             *s = '\0';
4499             kw = keyword(w, s - w) || perl_get_cv(w, FALSE) != 0;
4500             *s = ',';
4501             if (kw)
4502                 return;
4503             croak("No comma allowed after %s", what);
4504         }
4505     }
4506 }
4507
4508 static char *
4509 scan_word(register char *s, char *dest, STRLEN destlen, int allow_package, STRLEN *slp)
4510 {
4511     register char *d = dest;
4512     register char *e = d + destlen - 3;  /* two-character token, ending NUL */
4513     for (;;) {
4514         if (d >= e)
4515             croak(ident_too_long);
4516         if (isALNUM(*s))
4517             *d++ = *s++;
4518         else if (*s == '\'' && allow_package && isIDFIRST(s[1])) {
4519             *d++ = ':';
4520             *d++ = ':';
4521             s++;
4522         }
4523         else if (*s == ':' && s[1] == ':' && allow_package && isIDFIRST(s[2])) {
4524             *d++ = *s++;
4525             *d++ = *s++;
4526         }
4527         else {
4528             *d = '\0';
4529             *slp = d - dest;
4530             return s;
4531         }
4532     }
4533 }
4534
4535 static char *
4536 scan_ident(register char *s, register char *send, char *dest, STRLEN destlen, I32 ck_uni)
4537 {
4538     register char *d;
4539     register char *e;
4540     char *bracket = 0;
4541     char funny = *s++;
4542
4543     if (lex_brackets == 0)
4544         lex_fakebrack = 0;
4545     if (isSPACE(*s))
4546         s = skipspace(s);
4547     d = dest;
4548     e = d + destlen - 3;        /* two-character token, ending NUL */
4549     if (isDIGIT(*s)) {
4550         while (isDIGIT(*s)) {
4551             if (d >= e)
4552                 croak(ident_too_long);
4553             *d++ = *s++;
4554         }
4555     }
4556     else {
4557         for (;;) {
4558             if (d >= e)
4559                 croak(ident_too_long);
4560             if (isALNUM(*s))
4561                 *d++ = *s++;
4562             else if (*s == '\'' && isIDFIRST(s[1])) {
4563                 *d++ = ':';
4564                 *d++ = ':';
4565                 s++;
4566             }
4567             else if (*s == ':' && s[1] == ':') {
4568                 *d++ = *s++;
4569                 *d++ = *s++;
4570             }
4571             else
4572                 break;
4573         }
4574     }
4575     *d = '\0';
4576     d = dest;
4577     if (*d) {
4578         if (lex_state != LEX_NORMAL)
4579             lex_state = LEX_INTERPENDMAYBE;
4580         return s;
4581     }
4582     if (*s == '$' && s[1] &&
4583       (isALNUM(s[1]) || strchr("${", s[1]) || strnEQ(s+1,"::",2)) )
4584     {
4585         if (isDIGIT(s[1]) && lex_state == LEX_INTERPNORMAL)
4586             deprecate("\"$$<digit>\" to mean \"${$}<digit>\"");
4587         else
4588             return s;
4589     }
4590     if (*s == '{') {
4591         bracket = s;
4592         s++;
4593     }
4594     else if (ck_uni)
4595         check_uni();
4596     if (s < send)
4597         *d = *s++;
4598     d[1] = '\0';
4599     if (*d == '^' && *s && (isUPPER(*s) || strchr("[\\]^_?", *s))) {
4600         *d = toCTRL(*s);
4601         s++;
4602     }
4603     if (bracket) {
4604         if (isSPACE(s[-1])) {
4605             while (s < send) {
4606                 char ch = *s++;
4607                 if (ch != ' ' && ch != '\t') {
4608                     *d = ch;
4609                     break;
4610                 }
4611             }
4612         }
4613         if (isIDFIRST(*d)) {
4614             d++;
4615             while (isALNUM(*s) || *s == ':')
4616                 *d++ = *s++;
4617             *d = '\0';
4618             while (s < send && (*s == ' ' || *s == '\t')) s++;
4619             if ((*s == '[' || (*s == '{' && strNE(dest, "sub")))) {
4620                 if (dowarn && keyword(dest, d - dest)) {
4621                     char *brack = *s == '[' ? "[...]" : "{...}";
4622                     warn("Ambiguous use of %c{%s%s} resolved to %c%s%s",
4623                         funny, dest, brack, funny, dest, brack);
4624                 }
4625                 lex_fakebrack = lex_brackets+1;
4626                 bracket++;
4627                 lex_brackstack[lex_brackets++] = XOPERATOR;
4628                 return s;
4629             }
4630         }
4631         if (*s == '}') {
4632             s++;
4633             if (lex_state == LEX_INTERPNORMAL && !lex_brackets)
4634                 lex_state = LEX_INTERPEND;
4635             if (funny == '#')
4636                 funny = '@';
4637             if (dowarn && lex_state == LEX_NORMAL &&
4638               (keyword(dest, d - dest) || perl_get_cv(dest, FALSE)))
4639                 warn("Ambiguous use of %c{%s} resolved to %c%s",
4640                     funny, dest, funny, dest);
4641         }
4642         else {
4643             s = bracket;                /* let the parser handle it */
4644             *dest = '\0';
4645         }
4646     }
4647     else if (lex_state == LEX_INTERPNORMAL && !lex_brackets && !intuit_more(s))
4648         lex_state = LEX_INTERPEND;
4649     return s;
4650 }
4651
4652 void pmflag(U16 *pmfl, int ch)
4653 {
4654     if (ch == 'i')
4655         *pmfl |= PMf_FOLD;
4656     else if (ch == 'g')
4657         *pmfl |= PMf_GLOBAL;
4658     else if (ch == 'c')
4659         *pmfl |= PMf_CONTINUE;
4660     else if (ch == 'o')
4661         *pmfl |= PMf_KEEP;
4662     else if (ch == 'm')
4663         *pmfl |= PMf_MULTILINE;
4664     else if (ch == 's')
4665         *pmfl |= PMf_SINGLELINE;
4666     else if (ch == 'x')
4667         *pmfl |= PMf_EXTENDED;
4668 }
4669
4670 static char *
4671 scan_pat(char *start)
4672 {
4673     PMOP *pm;
4674     char *s;
4675
4676     s = scan_str(start);
4677     if (!s) {
4678         if (lex_stuff)
4679             SvREFCNT_dec(lex_stuff);
4680         lex_stuff = Nullsv;
4681         croak("Search pattern not terminated");
4682     }
4683
4684     pm = (PMOP*)newPMOP(OP_MATCH, 0);
4685     if (multi_open == '?')
4686         pm->op_pmflags |= PMf_ONCE;
4687     while (*s && strchr("iogcmsx", *s))
4688         pmflag(&pm->op_pmflags,*s++);
4689     pm->op_pmpermflags = pm->op_pmflags;
4690
4691     lex_op = (OP*)pm;
4692     yylval.ival = OP_MATCH;
4693     return s;
4694 }
4695
4696 static char *
4697 scan_subst(char *start)
4698 {
4699     register char *s;
4700     register PMOP *pm;
4701     I32 first_start;
4702     I32 es = 0;
4703
4704     yylval.ival = OP_NULL;
4705
4706     s = scan_str(start);
4707
4708     if (!s) {
4709         if (lex_stuff)
4710             SvREFCNT_dec(lex_stuff);
4711         lex_stuff = Nullsv;
4712         croak("Substitution pattern not terminated");
4713     }
4714
4715     if (s[-1] == multi_open)
4716         s--;
4717
4718     first_start = multi_start;
4719     s = scan_str(s);
4720     if (!s) {
4721         if (lex_stuff)
4722             SvREFCNT_dec(lex_stuff);
4723         lex_stuff = Nullsv;
4724         if (lex_repl)
4725             SvREFCNT_dec(lex_repl);
4726         lex_repl = Nullsv;
4727         croak("Substitution replacement not terminated");
4728     }
4729     multi_start = first_start;  /* so whole substitution is taken together */
4730
4731     pm = (PMOP*)newPMOP(OP_SUBST, 0);
4732     while (*s && strchr("iogcmsex", *s)) {
4733         if (*s == 'e') {
4734             s++;
4735             es++;
4736         }
4737         else
4738             pmflag(&pm->op_pmflags,*s++);
4739     }
4740
4741     if (es) {
4742         SV *repl;
4743         pm->op_pmflags |= PMf_EVAL;
4744         repl = newSVpv("",0);
4745         while (es-- > 0)
4746             sv_catpv(repl, es ? "eval " : "do ");
4747         sv_catpvn(repl, "{ ", 2);
4748         sv_catsv(repl, lex_repl);
4749         sv_catpvn(repl, " };", 2);
4750         SvCOMPILED_on(repl);
4751         SvREFCNT_dec(lex_repl);
4752         lex_repl = repl;
4753     }
4754
4755     pm->op_pmpermflags = pm->op_pmflags;
4756     lex_op = (OP*)pm;
4757     yylval.ival = OP_SUBST;
4758     return s;
4759 }
4760
4761 static char *
4762 scan_trans(char *start)
4763 {
4764     register char* s;
4765     OP *o;
4766     short *tbl;
4767     I32 squash;
4768     I32 Delete;
4769     I32 complement;
4770
4771     yylval.ival = OP_NULL;
4772
4773     s = scan_str(start);
4774     if (!s) {
4775         if (lex_stuff)
4776             SvREFCNT_dec(lex_stuff);
4777         lex_stuff = Nullsv;
4778         croak("Translation pattern not terminated");
4779     }
4780     if (s[-1] == multi_open)
4781         s--;
4782
4783     s = scan_str(s);
4784     if (!s) {
4785         if (lex_stuff)
4786             SvREFCNT_dec(lex_stuff);
4787         lex_stuff = Nullsv;
4788         if (lex_repl)
4789             SvREFCNT_dec(lex_repl);
4790         lex_repl = Nullsv;
4791         croak("Translation replacement not terminated");
4792     }
4793
4794     New(803,tbl,256,short);
4795     o = newPVOP(OP_TRANS, 0, (char*)tbl);
4796
4797     complement = Delete = squash = 0;
4798     while (*s == 'c' || *s == 'd' || *s == 's') {
4799         if (*s == 'c')
4800             complement = OPpTRANS_COMPLEMENT;
4801         else if (*s == 'd')
4802             Delete = OPpTRANS_DELETE;
4803         else
4804             squash = OPpTRANS_SQUASH;
4805         s++;
4806     }
4807     o->op_private = Delete|squash|complement;
4808
4809     lex_op = o;
4810     yylval.ival = OP_TRANS;
4811     return s;
4812 }
4813
4814 static char *
4815 scan_heredoc(register char *s)
4816 {
4817     dTHR;
4818     SV *herewas;
4819     I32 op_type = OP_SCALAR;
4820     I32 len;
4821     SV *tmpstr;
4822     char term;
4823     register char *d;
4824     register char *e;
4825     char *peek;
4826     int outer = (rsfp && !lex_inwhat);
4827
4828     s += 2;
4829     d = tokenbuf;
4830     e = tokenbuf + sizeof tokenbuf - 1;
4831     if (!outer)
4832         *d++ = '\n';
4833     for (peek = s; *peek == ' ' || *peek == '\t'; peek++) ;
4834     if (*peek && strchr("`'\"",*peek)) {
4835         s = peek;
4836         term = *s++;
4837         s = delimcpy(d, e, s, bufend, term, &len);
4838         d += len;
4839         if (s < bufend)
4840             s++;
4841     }
4842     else {
4843         if (*s == '\\')
4844             s++, term = '\'';
4845         else
4846             term = '"';
4847         if (!isALNUM(*s))
4848             deprecate("bare << to mean <<\"\"");
4849         for (; isALNUM(*s); s++) {
4850             if (d < e)
4851                 *d++ = *s;
4852         }
4853     }
4854     if (d >= tokenbuf + sizeof tokenbuf - 1)
4855         croak("Delimiter for here document is too long");
4856     *d++ = '\n';
4857     *d = '\0';
4858     len = d - tokenbuf;
4859     d = "\n";
4860     if (outer || !(d=ninstr(s,bufend,d,d+1)))
4861         herewas = newSVpv(s,bufend-s);
4862     else
4863         s--, herewas = newSVpv(s,d-s);
4864     s += SvCUR(herewas);
4865
4866     tmpstr = NEWSV(87,80);
4867     sv_upgrade(tmpstr, SVt_PVIV);
4868     if (term == '\'') {
4869         op_type = OP_CONST;
4870         SvIVX(tmpstr) = -1;
4871     }
4872     else if (term == '`') {
4873         op_type = OP_BACKTICK;
4874         SvIVX(tmpstr) = '\\';
4875     }
4876
4877     CLINE;
4878     multi_start = curcop->cop_line;
4879     multi_open = multi_close = '<';
4880     term = *tokenbuf;
4881     if (!outer) {
4882         d = s;
4883         while (s < bufend &&
4884           (*s != term || memNE(s,tokenbuf,len)) ) {
4885             if (*s++ == '\n')
4886                 curcop->cop_line++;
4887         }
4888         if (s >= bufend) {
4889             curcop->cop_line = multi_start;
4890             missingterm(tokenbuf);
4891         }
4892         sv_setpvn(tmpstr,d+1,s-d);
4893         s += len - 1;
4894         curcop->cop_line++;     /* the preceding stmt passes a newline */
4895
4896         sv_catpvn(herewas,s,bufend-s);
4897         sv_setsv(linestr,herewas);
4898         oldoldbufptr = oldbufptr = bufptr = s = linestart = SvPVX(linestr);
4899         bufend = SvPVX(linestr) + SvCUR(linestr);
4900     }
4901     else
4902         sv_setpvn(tmpstr,"",0);   /* avoid "uninitialized" warning */
4903     while (s >= bufend) {       /* multiple line string? */
4904         if (!outer ||
4905          !(oldoldbufptr = oldbufptr = s = linestart = filter_gets(linestr, rsfp, 0))) {
4906             curcop->cop_line = multi_start;
4907             missingterm(tokenbuf);
4908         }
4909         curcop->cop_line++;
4910         if (PERLDB_LINE && curstash != debstash) {
4911             SV *sv = NEWSV(88,0);
4912
4913             sv_upgrade(sv, SVt_PVMG);
4914             sv_setsv(sv,linestr);
4915             av_store(GvAV(curcop->cop_filegv),
4916               (I32)curcop->cop_line,sv);
4917         }
4918         bufend = SvPVX(linestr) + SvCUR(linestr);
4919         if (*s == term && memEQ(s,tokenbuf,len)) {
4920             s = bufend - 1;
4921             *s = ' ';
4922             sv_catsv(linestr,herewas);
4923             bufend = SvPVX(linestr) + SvCUR(linestr);
4924         }
4925         else {
4926             s = bufend;
4927             sv_catsv(tmpstr,linestr);
4928         }
4929     }
4930     multi_end = curcop->cop_line;
4931     s++;
4932     if (SvCUR(tmpstr) + 5 < SvLEN(tmpstr)) {
4933         SvLEN_set(tmpstr, SvCUR(tmpstr) + 1);
4934         Renew(SvPVX(tmpstr), SvLEN(tmpstr), char);
4935     }
4936     SvREFCNT_dec(herewas);
4937     lex_stuff = tmpstr;
4938     yylval.ival = op_type;
4939     return s;
4940 }
4941
4942 static char *
4943 scan_inputsymbol(char *start)
4944 {
4945     register char *s = start;
4946     register char *d;
4947     register char *e;
4948     I32 len;
4949
4950     d = tokenbuf;
4951     e = tokenbuf + sizeof tokenbuf;
4952     s = delimcpy(d, e, s + 1, bufend, '>', &len);
4953     if (len >= sizeof tokenbuf)
4954         croak("Excessively long <> operator");
4955     if (s >= bufend)
4956         croak("Unterminated <> operator");
4957     s++;
4958     if (*d == '$' && d[1]) d++;
4959     while (*d && (isALNUM(*d) || *d == '\'' || *d == ':'))
4960         d++;
4961     if (d - tokenbuf != len) {
4962         yylval.ival = OP_GLOB;
4963         set_csh();
4964         s = scan_str(start);
4965         if (!s)
4966             croak("Glob not terminated");
4967         return s;
4968     }
4969     else {
4970         d = tokenbuf;
4971         if (!len)
4972             (void)strcpy(d,"ARGV");
4973         if (*d == '$') {
4974             I32 tmp;
4975             if ((tmp = pad_findmy(d)) != NOT_IN_PAD) {
4976                 OP *o = newOP(OP_PADSV, 0);
4977                 o->op_targ = tmp;
4978                 lex_op = (OP*)newUNOP(OP_READLINE, 0, newUNOP(OP_RV2GV, 0, o));
4979             }
4980             else {
4981                 GV *gv = gv_fetchpv(d+1,TRUE, SVt_PV);
4982                 lex_op = (OP*)newUNOP(OP_READLINE, 0,
4983                                         newUNOP(OP_RV2GV, 0,
4984                                             newUNOP(OP_RV2SV, 0,
4985                                                 newGVOP(OP_GV, 0, gv))));
4986             }
4987             yylval.ival = OP_NULL;
4988         }
4989         else {
4990             GV *gv = gv_fetchpv(d,TRUE, SVt_PVIO);
4991             lex_op = (OP*)newUNOP(OP_READLINE, 0, newGVOP(OP_GV, 0, gv));
4992             yylval.ival = OP_NULL;
4993         }
4994     }
4995     return s;
4996 }
4997
4998 static char *
4999 scan_str(char *start)
5000 {
5001     dTHR;
5002     SV *sv;
5003     char *tmps;
5004     register char *s = start;
5005     register char term;
5006     register char *to;
5007     I32 brackets = 1;
5008
5009     if (isSPACE(*s))
5010         s = skipspace(s);
5011     CLINE;
5012     term = *s;
5013     multi_start = curcop->cop_line;
5014     multi_open = term;
5015     if (term && (tmps = strchr("([{< )]}> )]}>",term)))
5016         term = tmps[5];
5017     multi_close = term;
5018
5019     sv = NEWSV(87,80);
5020     sv_upgrade(sv, SVt_PVIV);
5021     SvIVX(sv) = term;
5022     (void)SvPOK_only(sv);               /* validate pointer */
5023     s++;
5024     for (;;) {
5025         SvGROW(sv, SvCUR(sv) + (bufend - s) + 1);
5026         to = SvPVX(sv)+SvCUR(sv);
5027         if (multi_open == multi_close) {
5028             for (; s < bufend; s++,to++) {
5029                 if (*s == '\n' && !rsfp)
5030                     curcop->cop_line++;
5031                 if (*s == '\\' && s+1 < bufend && term != '\\') {
5032                     if (s[1] == term)
5033                         s++;
5034                     else
5035                         *to++ = *s++;
5036                 }
5037                 else if (*s == term)
5038                     break;
5039                 *to = *s;
5040             }
5041         }
5042         else {
5043             for (; s < bufend; s++,to++) {
5044                 if (*s == '\n' && !rsfp)
5045                     curcop->cop_line++;
5046                 if (*s == '\\' && s+1 < bufend) {
5047                     if ((s[1] == multi_open) || (s[1] == multi_close))
5048                         s++;
5049                     else
5050                         *to++ = *s++;
5051                 }
5052                 else if (*s == multi_close && --brackets <= 0)
5053                     break;
5054                 else if (*s == multi_open)
5055                     brackets++;
5056                 *to = *s;
5057             }
5058         }
5059         *to = '\0';
5060         SvCUR_set(sv, to - SvPVX(sv));
5061
5062     if (s < bufend) break;      /* string ends on this line? */
5063
5064         if (!rsfp ||
5065          !(oldoldbufptr = oldbufptr = s = linestart = filter_gets(linestr, rsfp, 0))) {
5066             sv_free(sv);
5067             curcop->cop_line = multi_start;
5068             return Nullch;
5069         }
5070         curcop->cop_line++;
5071         if (PERLDB_LINE && curstash != debstash) {
5072             SV *sv = NEWSV(88,0);
5073
5074             sv_upgrade(sv, SVt_PVMG);
5075             sv_setsv(sv,linestr);
5076             av_store(GvAV(curcop->cop_filegv),
5077               (I32)curcop->cop_line, sv);
5078         }
5079         bufend = SvPVX(linestr) + SvCUR(linestr);
5080     }
5081     multi_end = curcop->cop_line;
5082     s++;
5083     if (SvCUR(sv) + 5 < SvLEN(sv)) {
5084         SvLEN_set(sv, SvCUR(sv) + 1);
5085         Renew(SvPVX(sv), SvLEN(sv), char);
5086     }
5087     if (lex_stuff)
5088         lex_repl = sv;
5089     else
5090         lex_stuff = sv;
5091     return s;
5092 }
5093
5094 char *
5095 scan_num(char *start)
5096 {
5097     register char *s = start;
5098     register char *d;
5099     register char *e;
5100     I32 tryiv;
5101     double value;
5102     SV *sv;
5103     I32 floatit;
5104     char *lastub = 0;
5105     static char number_too_long[] = "Number too long";
5106
5107     switch (*s) {
5108     default:
5109         croak("panic: scan_num");
5110     case '0':
5111         {
5112             UV u;
5113             I32 shift;
5114             bool overflowed = FALSE;
5115
5116             if (s[1] == 'x') {
5117                 shift = 4;
5118                 s += 2;
5119             }
5120             else if (s[1] == '.')
5121                 goto decimal;
5122             else
5123                 shift = 3;
5124             u = 0;
5125             for (;;) {
5126                 UV n, b;
5127
5128                 switch (*s) {
5129                 default:
5130                     goto out;
5131                 case '_':
5132                     s++;
5133                     break;
5134                 case '8': case '9':
5135                     if (shift != 4)
5136                         yyerror("Illegal octal digit");
5137                     /* FALL THROUGH */
5138                 case '0': case '1': case '2': case '3': case '4':
5139                 case '5': case '6': case '7':
5140                     b = *s++ & 15;
5141                     goto digit;
5142                 case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
5143                 case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
5144                     if (shift != 4)
5145                         goto out;
5146                     b = (*s++ & 7) + 9;
5147                   digit:
5148                     n = u << shift;
5149                     if (!overflowed && (n >> shift) != u) {
5150                         warn("Integer overflow in %s number",
5151                              (shift == 4) ? "hex" : "octal");
5152                         overflowed = TRUE;
5153                     }
5154                     u = n | b;
5155                     break;
5156                 }
5157             }
5158           out:
5159             sv = NEWSV(92,0);
5160             sv_setuv(sv, u);
5161         }
5162         break;
5163     case '1': case '2': case '3': case '4': case '5':
5164     case '6': case '7': case '8': case '9': case '.':
5165       decimal:
5166         d = tokenbuf;
5167         e = tokenbuf + sizeof tokenbuf - 6; /* room for various punctuation */
5168         floatit = FALSE;
5169         while (isDIGIT(*s) || *s == '_') {
5170             if (*s == '_') {
5171                 if (dowarn && lastub && s - lastub != 3)
5172                     warn("Misplaced _ in number");
5173                 lastub = ++s;
5174             }
5175             else {
5176                 if (d >= e)
5177                     croak(number_too_long);
5178                 *d++ = *s++;
5179             }
5180         }
5181         if (dowarn && lastub && s - lastub != 3)
5182             warn("Misplaced _ in number");
5183         if (*s == '.' && s[1] != '.') {
5184             floatit = TRUE;
5185             *d++ = *s++;
5186             for (; isDIGIT(*s) || *s == '_'; s++) {
5187                 if (d >= e)
5188                     croak(number_too_long);
5189                 if (*s != '_')
5190                     *d++ = *s;
5191             }
5192         }
5193         if (*s && strchr("eE",*s) && strchr("+-0123456789",s[1])) {
5194             floatit = TRUE;
5195             s++;
5196             *d++ = 'e';         /* At least some Mach atof()s don't grok 'E' */
5197             if (*s == '+' || *s == '-')
5198                 *d++ = *s++;
5199             while (isDIGIT(*s)) {
5200                 if (d >= e)
5201                     croak(number_too_long);
5202                 *d++ = *s++;
5203             }
5204         }
5205         *d = '\0';
5206         sv = NEWSV(92,0);
5207         SET_NUMERIC_STANDARD();
5208         value = atof(tokenbuf);
5209         tryiv = I_V(value);
5210         if (!floatit && (double)tryiv == value)
5211             sv_setiv(sv, tryiv);
5212         else
5213             sv_setnv(sv, value);
5214         break;
5215     }
5216
5217     yylval.opval = newSVOP(OP_CONST, 0, sv);
5218
5219     return s;
5220 }
5221
5222 static char *
5223 scan_formline(register char *s)
5224 {
5225     dTHR;
5226     register char *eol;
5227     register char *t;
5228     SV *stuff = newSVpv("",0);
5229     bool needargs = FALSE;
5230
5231     while (!needargs) {
5232         if (*s == '.' || *s == '}') {
5233             /*SUPPRESS 530*/
5234             for (t = s+1; *t == ' ' || *t == '\t'; t++) ;
5235             if (*t == '\n')
5236                 break;
5237         }
5238         if (in_eval && !rsfp) {
5239             eol = strchr(s,'\n');
5240             if (!eol++)
5241                 eol = bufend;
5242         }
5243         else
5244             eol = bufend = SvPVX(linestr) + SvCUR(linestr);
5245         if (*s != '#') {
5246             for (t = s; t < eol; t++) {
5247                 if (*t == '~' && t[1] == '~' && SvCUR(stuff)) {
5248                     needargs = FALSE;
5249                     goto enough;        /* ~~ must be first line in formline */
5250                 }
5251                 if (*t == '@' || *t == '^')
5252                     needargs = TRUE;
5253             }
5254             sv_catpvn(stuff, s, eol-s);
5255         }
5256         s = eol;
5257         if (rsfp) {
5258             s = filter_gets(linestr, rsfp, 0);
5259             oldoldbufptr = oldbufptr = bufptr = linestart = SvPVX(linestr);
5260             bufend = bufptr + SvCUR(linestr);
5261             if (!s) {
5262                 s = bufptr;
5263                 yyerror("Format not terminated");
5264                 break;
5265             }
5266         }
5267         incline(s);
5268     }
5269   enough:
5270     if (SvCUR(stuff)) {
5271         expect = XTERM;
5272         if (needargs) {
5273             lex_state = LEX_NORMAL;
5274             nextval[nexttoke].ival = 0;
5275             force_next(',');
5276         }
5277         else
5278             lex_state = LEX_FORMLINE;
5279         nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, stuff);
5280         force_next(THING);
5281         nextval[nexttoke].ival = OP_FORMLINE;
5282         force_next(LSTOP);
5283     }
5284     else {
5285         SvREFCNT_dec(stuff);
5286         lex_formbrack = 0;
5287         bufptr = s;
5288     }
5289     return s;
5290 }
5291
5292 static void
5293 set_csh(void)
5294 {
5295 #ifdef CSH
5296     if (!cshlen)
5297         cshlen = strlen(cshname);
5298 #endif
5299 }
5300
5301 I32
5302 start_subparse(I32 is_format, U32 flags)
5303 {
5304     dTHR;
5305     I32 oldsavestack_ix = savestack_ix;
5306     CV* outsidecv = compcv;
5307     AV* comppadlist;
5308
5309     if (compcv) {
5310         assert(SvTYPE(compcv) == SVt_PVCV);
5311     }
5312     save_I32(&subline);
5313     save_item(subname);
5314     SAVEI32(padix);
5315     SAVESPTR(curpad);
5316     SAVESPTR(comppad);
5317     SAVESPTR(comppad_name);
5318     SAVESPTR(compcv);
5319     SAVEI32(comppad_name_fill);
5320     SAVEI32(min_intro_pending);
5321     SAVEI32(max_intro_pending);
5322     SAVEI32(pad_reset_pending);
5323
5324     compcv = (CV*)NEWSV(1104,0);
5325     sv_upgrade((SV *)compcv, is_format ? SVt_PVFM : SVt_PVCV);
5326     CvFLAGS(compcv) |= flags;
5327
5328     comppad = newAV();
5329     av_push(comppad, Nullsv);
5330     curpad = AvARRAY(comppad);
5331     comppad_name = newAV();
5332     comppad_name_fill = 0;
5333     min_intro_pending = 0;
5334     padix = 0;
5335     subline = curcop->cop_line;
5336 #ifdef USE_THREADS
5337     av_store(comppad_name, 0, newSVpv("@_", 2));
5338     curpad[0] = (SV*)newAV();
5339     SvPADMY_on(curpad[0]);      /* XXX Needed? */
5340     CvOWNER(compcv) = 0;
5341     New(666, CvMUTEXP(compcv), 1, perl_mutex);
5342     MUTEX_INIT(CvMUTEXP(compcv));
5343 #endif /* USE_THREADS */
5344
5345     comppadlist = newAV();
5346     AvREAL_off(comppadlist);
5347     av_store(comppadlist, 0, (SV*)comppad_name);
5348     av_store(comppadlist, 1, (SV*)comppad);
5349
5350     CvPADLIST(compcv) = comppadlist;
5351     CvOUTSIDE(compcv) = (CV*)SvREFCNT_inc(outsidecv);
5352 #ifdef USE_THREADS
5353     CvOWNER(compcv) = 0;
5354     New(666, CvMUTEXP(compcv), 1, perl_mutex);
5355     MUTEX_INIT(CvMUTEXP(compcv));
5356 #endif /* USE_THREADS */
5357
5358     return oldsavestack_ix;
5359 }
5360
5361 int
5362 yywarn(char *s)
5363 {
5364     dTHR;
5365     --error_count;
5366     in_eval |= 2;
5367     yyerror(s);
5368     in_eval &= ~2;
5369     return 0;
5370 }
5371
5372 int
5373 yyerror(char *s)
5374 {
5375     dTHR;
5376     char *where = NULL;
5377     char *context = NULL;
5378     int contlen = -1;
5379     SV *msg;
5380
5381     if (!yychar || (yychar == ';' && !rsfp))
5382         where = "at EOF";
5383     else if (bufptr > oldoldbufptr && bufptr - oldoldbufptr < 200 &&
5384       oldoldbufptr != oldbufptr && oldbufptr != bufptr) {
5385         while (isSPACE(*oldoldbufptr))
5386             oldoldbufptr++;
5387         context = oldoldbufptr;
5388         contlen = bufptr - oldoldbufptr;
5389     }
5390     else if (bufptr > oldbufptr && bufptr - oldbufptr < 200 &&
5391       oldbufptr != bufptr) {
5392         while (isSPACE(*oldbufptr))
5393             oldbufptr++;
5394         context = oldbufptr;
5395         contlen = bufptr - oldbufptr;
5396     }
5397     else if (yychar > 255)
5398         where = "next token ???";
5399     else if ((yychar & 127) == 127) {
5400         if (lex_state == LEX_NORMAL ||
5401            (lex_state == LEX_KNOWNEXT && lex_defer == LEX_NORMAL))
5402             where = "at end of line";
5403         else if (lex_inpat)
5404             where = "within pattern";
5405         else
5406             where = "within string";
5407     }
5408     else {
5409         SV *where_sv = sv_2mortal(newSVpv("next char ", 0));
5410         if (yychar < 32)
5411             sv_catpvf(where_sv, "^%c", toCTRL(yychar));
5412         else if (isPRINT_LC(yychar))
5413             sv_catpvf(where_sv, "%c", yychar);
5414         else
5415             sv_catpvf(where_sv, "\\%03o", yychar & 255);
5416         where = SvPVX(where_sv);
5417     }
5418     msg = sv_2mortal(newSVpv(s, 0));
5419     sv_catpvf(msg, " at %_ line %ld, ",
5420               GvSV(curcop->cop_filegv), (long)curcop->cop_line);
5421     if (context)
5422         sv_catpvf(msg, "near \"%.*s\"\n", contlen, context);
5423     else
5424         sv_catpvf(msg, "%s\n", where);
5425     if (multi_start < multi_end && (U32)(curcop->cop_line - multi_end) <= 1) {
5426         sv_catpvf(msg,
5427         "  (Might be a runaway multi-line %c%c string starting on line %ld)\n",
5428                 (int)multi_open,(int)multi_close,(long)multi_start);
5429         multi_end = 0;
5430     }
5431     if (in_eval & 2)
5432         warn("%_", msg);
5433     else if (in_eval)
5434         sv_catsv(ERRSV, msg);
5435     else
5436         PerlIO_write(PerlIO_stderr(), SvPVX(msg), SvCUR(msg));
5437     if (++error_count >= 10)
5438         croak("%_ has too many errors.\n", GvSV(curcop->cop_filegv));
5439     in_my = 0;
5440     in_my_stash = Nullhv;
5441     return 0;
5442 }
5443
5444