isabelle: doc-src/TutorialI/CodeGen/CodeGen.thy@c613cd06d5cf (annotated)

8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	1	(<)
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	2	theory CodeGen = Main:
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	3	(>)
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	4
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	5	text{*\noindent
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	6	The task is to develop a compiler from a generic type of expressions (built
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	7	up from variables, constants and binary operations) to a stack machine. This
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	8	generic type of expressions is a generalization of the boolean expressions in
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	9	\S\ref{sec:boolex}. This time we do not commit ourselves to a particular
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	10	type of variables or values but make them type parameters. Neither is there
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	11	a fixed set of binary operations: instead the expression contains the
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	12	appropriate function itself.
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	13	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	14
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	15	types 'v binop = "'v \\<Rightarrow> 'v \\<Rightarrow> 'v";
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	16	datatype ('a,'v)expr = Cex 'v
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	17	\| Vex 'a
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	18	\| Bex "'v binop" "('a,'v)expr" "('a,'v)expr";
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	19
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	20	text{*\noindent
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	21	The three constructors represent constants, variables and the application of
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	22	a binary operation to two subexpressions.
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	23
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	24	The value of an expression w.r.t.\ an environment that maps variables to
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	25	values is easily defined:
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	26	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	27
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	28	consts value :: "('a,'v)expr \\<Rightarrow> ('a \\<Rightarrow> 'v) \\<Rightarrow> 'v";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	29	primrec
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	30	"value (Cex v) env = v"
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	31	"value (Vex a) env = env a"
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	32	"value (Bex f e1 e2) env = f (value e1 env) (value e2 env)";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	33
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	34	text{*
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	35	The stack machine has three instructions: load a constant value onto the
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	36	stack, load the contents of a certain address onto the stack, and apply a
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	37	binary operation to the two topmost elements of the stack, replacing them by
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	38	the result. As for \isa{expr}, addresses and values are type parameters:
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	39	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	40
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	41	datatype ('a,'v) instr = Const 'v
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	42	\| Load 'a
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	43	\| Apply "'v binop";
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	44
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	45	text{*
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	46	The execution of the stack machine is modelled by a function
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	47	\isa{exec} that takes a list of instructions, a store (modelled as a
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	48	function from addresses to values, just like the environment for
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	49	evaluating expressions), and a stack (modelled as a list) of values,
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	50	and returns the stack at the end of the execution---the store remains
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	51	unchanged:
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	52	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	53
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	54	consts exec :: "('a,'v)instr list \\<Rightarrow> ('a\\<Rightarrow>'v) \\<Rightarrow> 'v list \\<Rightarrow> 'v list";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	55	primrec
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	56	"exec [] s vs = vs"
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	57	"exec (i#is) s vs = (case i of
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	58	Const v \\<Rightarrow> exec is s (v#vs)
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	59	\| Load a \\<Rightarrow> exec is s ((s a)#vs)
026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	60	\| Apply f \\<Rightarrow> exec is s ((f (hd vs) (hd(tl vs)))#(tl(tl vs))))";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	61
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	62	text{*\noindent
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	63	Recall that \isa{hd} and \isa{tl}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	64	return the first element and the remainder of a list.
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	65	Because all functions are total, \isa{hd} is defined even for the empty
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	66	list, although we do not know what the result is. Thus our model of the
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	67	machine always terminates properly, although the above definition does not
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	68	tell us much about the result in situations where \isa{Apply} was executed
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	69	with fewer than two elements on the stack.
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	70
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	71	The compiler is a function from expressions to a list of instructions. Its
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	72	definition is pretty much obvious:
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	73	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	74
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	75	consts comp :: "('a,'v)expr \\<Rightarrow> ('a,'v)instr list";
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	76	primrec
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	77	"comp (Cex v) = [Const v]"
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	78	"comp (Vex a) = [Load a]"
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	79	"comp (Bex f e1 e2) = (comp e2) @ (comp e1) @ [Apply f]";
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	80
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	81	text{*
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	82	Now we have to prove the correctness of the compiler, i.e.\ that the
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	83	execution of a compiled expression results in the value of the expression:
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	84	*}
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	85	theorem "exec (comp e) s [] = [value e s]";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	86	(<)oops;(>)
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	87	text{*\noindent
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	88	This theorem needs to be generalized to
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	89	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	90
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	91	theorem "\\<forall>vs. exec (comp e) s vs = (value e s) # vs";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	92
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	93	txt{*\noindent
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	94	which is proved by induction on \isa{e} followed by simplification, once
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	95	we have the following lemma about executing the concatenation of two
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	96	instruction sequences:
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	97	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	98	(<)oops;(>)
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	99	lemma exec_app[simp]:
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	100	"\\<forall>vs. exec (xs@ys) s vs = exec ys s (exec xs s vs)";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	101
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	102	txt{*\noindent
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	103	This requires induction on \isa{xs} and ordinary simplification for the
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	104	base cases. In the induction step, simplification leaves us with a formula
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	105	that contains two \isa{case}-expressions over instructions. Thus we add
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	106	automatic case splitting as well, which finishes the proof:
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	107	*}
9458 c613cd06d5cf apply. -> by nipkow parents: 8771 diff changeset	108	by(induct_tac xs, simp, simp split: instr.split);
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	109
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	110	text{*\noindent
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	111	Note that because \isaindex{auto} performs simplification, it can
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	112	also be modified in the same way \isa{simp} can. Thus the proof can be
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	113	rewritten as
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	114	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	115	(<)
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	116	lemmas [simp del] = exec_app;
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	117	lemma [simp]: "\\<forall>vs. exec (xs@ys) s vs = exec ys s (exec xs s vs)";
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	118	(>)
9458 c613cd06d5cf apply. -> by nipkow parents: 8771 diff changeset	119	by(induct_tac xs, auto split: instr.split);
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	120
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	121	text{*\noindent
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	122	Although this is more compact, it is less clear for the reader of the proof.
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	123
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	124	We could now go back and prove \isa{exec (comp e) s [] = [value e s]}
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	125	merely by simplification with the generalized version we just proved.
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	126	However, this is unnecessary because the generalized version fully subsumes
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	127	its instance.
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	128	*}
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	129	(<)
8771 026f37a86ea7 * empty log message * nipkow parents: 8744 diff changeset	130	theorem "\\<forall>vs. exec (comp e) s vs = (value e s) # vs";
9458 c613cd06d5cf apply. -> by nipkow parents: 8771 diff changeset	131	by(induct_tac e, auto);
8744 22fa8b16c3ae * empty log message * nipkow parents: diff changeset	132	end
22fa8b16c3ae * empty log message * nipkow parents: diff changeset	133	(>)

author	nipkow
	Fri, 28 Jul 2000 16:02:51 +0200
changeset 9458	c613cd06d5cf
parent 8771	026f37a86ea7
child 9792	bbefb6ce5cb2
permissions	-rw-r--r--