stmtlist: /* nothing */ { $$ = progp; }
| stmtlist '\n'
| stmtlist stmt
;
expr: NUMBER { $$ = code2(constpush, (Inst)$1); }
| VAR { $$ = code3(varpush, (Inst)$1, eval); }
| asgn
| BLTIN '(' expr ')'
{ $$ = $3; code2(bltin, (Inst)$1->u.ptr); }
| '(' expr ')' { $$ = $2; }
| expr '+' expr { code(add); }
| expr '-' expr { code(sub); }
| expr '*' expr { code(mul); }
| expr '/' expr { code(div); }
| expr '^' expr { code (power); }
| '-' expr %prec UNARYMINUS { $$ = $2; code(negate); }
| expr GT expr { code(gt); }
| expr GE expr { code(ge); }
| expr LT expr { code(lt); }
| expr LE expr { code(le); }
| expr EQ expr { code(eq); }
| expr NE expr { code(ne); }
| expr AND expr { code(and); }
| expr OR expr { code(or); }
| NOT expr { $$ = $2; code(not); }
%%
/* end of grammar */
В грамматике есть пять случаев неоднозначности типа сдвиг/свертка, подобных упомянутой в грамматике для hoc3
.
Обратите внимание на то, что команды STOP
, завершающие последовательность операторов, теперь порождаются в нескольких местах. Как и прежде, progp
здесь представляет собой адрес очередной создаваемой команды. При выполнении все команды STOP
служат для завершения цикла в функции execute
. Правило для понятия все по сути является подпрограммой, вызываемой из нескольких мест, именно оно порождает команду STOP
и возвращает адрес следующей за ней команды.
Команды, создаваемые для операторов if
и while
, требуют особого рассмотрения. Когда встречается ключевое слово while
, порождается операция whilecode
, и адрес этой команды возвращается в качестве значения правила
пока: WHILE
Но в то же самое время резервируются два следующих машинных слова, которые будут определены ниже. Далее создаются команды для выражения, которое образует условие в операторе while
. Значение, возвращаемое правилом cond
, является адресом начала команд для условия. После распознавания всего оператора while
в два зарезервированных слова, вводимых за командой whilecode
, заносится адрес начала тела цикла и адрес оператора, следующего за циклом. (Команда по этому адресу будет создана позднее.)
| пока усл опер все {
($1)[1] = (Inst) $3 /* тело цикла */
($1)[2] = (Inst) $4 /* все, если условие неверно */
}
Здесь $1
обозначает адрес команды whilecode
, таким образом, ($1)[1]
и ($1)[2]
обозначают два следующих слова.
Рисунок, приведенный ниже, может прояснить ситуацию:
С оператором if
дело обстоит аналогично, но резервируются три слова: для частей then
и else
, а также для оператора, следующего за if
. Мы вскоре рассмотрим этот случай.
Лексический анализ теперь несколько удлиняется в основном из-за необходимости распознавания дополнительных операций:
yylex() /* hoc5 */
{
...
switch (с) {
case '>': return follow('=', GE, GT);
case '<': return follow('=', LE, LT);
case '=': return follow('=', EQ, '=');
case '!': return follow('=', NE, NOT);
case '|': return follow('|', OR, '|');
case '&': return follow('&', AND, '&');
case '\n': lineno++; return '\n';
default: return c;
}
}
Функция follow
"смотрит" на один символ вперед и возвращает символ назад во входной поток с помощью ungetc
, если он оказался не тем, который требовался:
follow(expect, ifyes, ifno) /* look ahead for >=, etc. */
{
int с = getchar();
if (c == expect)
return ifyes;
ungetc(c, stdin);
return ifno;
}
В файле hoc.h
стало больше описаний функций, например всех отношений, но в общем его структура такая же, как и в hoc4
. Ниже приведено несколько последних строк грамматики:
$ cat hoc.h
...
typedef int (*Inst)(); /* machine instruction */
#define STOP (Inst)0
extern Inst prog[], *progp, *code();
Вильям Л Саймон , Вильям Саймон , Наталья Владимировна Макеева , Нора Робертс , Юрий Викторович Щербатых
Зарубежная компьютерная, околокомпьютерная литература / ОС и Сети, интернет / Короткие любовные романы / Психология / Прочая справочная литература / Образование и наука / Книги по IT / Словари и Энциклопедии