isabelle: src/Pure/Thy/thy_syntax.scala@6f6a9c8abbac (annotated)

34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	1	/* Title: Pure/Thy/thy_syntax.scala
b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	2	Author: Makarius
b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	3
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	4	Superficial theory syntax: tokens and spans.
34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	5	*/
b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	6
b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	7	package isabelle
b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	8
b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	9
38239 89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	10	import scala.collection.mutable
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	11	import scala.annotation.tailrec
38239 89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	12
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	13
34303 98425e77cfeb plain object; wenzelm parents: 34268 diff changeset	14	object Thy_Syntax
34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	15	{
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	16	/ parse spans /
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	17
38373 e8197eea3cd0 tuned; wenzelm parents: 38239 diff changeset	18	def parse_spans(toks: List[Token]): List[List[Token]] =
34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	19	{
38373 e8197eea3cd0 tuned; wenzelm parents: 38239 diff changeset	20	val result = new mutable.ListBuffer[List[Token]]
38239 89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	21	val span = new mutable.ListBuffer[Token]
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	22	val whitespace = new mutable.ListBuffer[Token]
34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	23
38239 89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	24	def flush(buffer: mutable.ListBuffer[Token])
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	25	{
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	26	if (!buffer.isEmpty) { result += buffer.toList; buffer.clear }
34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	27	}
38239 89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	28	for (tok <- toks) {
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	29	if (tok.is_command) { flush(span); flush(whitespace); span += tok }
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	30	else if (tok.is_ignored) whitespace += tok
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	31	else { span ++= whitespace; whitespace.clear; span += tok }
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	32	}
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	33	flush(span); flush(whitespace)
89a4d1028fb3 parse_spans: somewhat faster low-level implementation; wenzelm parents: 36956 diff changeset	34	result.toList
34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	35	}
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	36
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	37
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	38
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	39	/ text edits /
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	40
38417 b8922ae21111 renamed class Document to Document.Version etc.; wenzelm parents: 38374 diff changeset	41	def text_edits(session: Session, previous: Document.Version,
b8922ae21111 renamed class Document to Document.Version etc.; wenzelm parents: 38374 diff changeset	42	edits: List[Document.Node_Text_Edit]): (List[Document.Edit[Command]], Document.Version) =
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	43	{
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	44	/* phase 1: edit individual command source */
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	45
38425 e467db701d78 moved Text_Edit to Text.Edit; wenzelm parents: 38419 diff changeset	46	@tailrec def edit_text(eds: List[Text.Edit], commands: Linear_Set[Command])
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	47	: Linear_Set[Command] =
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	48	{
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	49	eds match {
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	50	case e :: es =>
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	51	Document.Node.command_starts(commands.iterator).find {
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	52	case (cmd, cmd_start) =>
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	53	e.can_edit(cmd.source, cmd_start) \|\|
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	54	e.is_insert && e.start == cmd_start + cmd.length
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	55	} match {
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	56	case Some((cmd, cmd_start)) if e.can_edit(cmd.source, cmd_start) =>
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	57	val (rest, text) = e.edit(cmd.source, cmd_start)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	58	val new_commands = commands.insert_after(Some(cmd), Command.unparsed(text)) - cmd
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	59	edit_text(rest.toList ::: es, new_commands)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	60
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	61	case Some((cmd, cmd_start)) =>
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	62	edit_text(es, commands.insert_after(Some(cmd), Command.unparsed(e.text)))
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	63
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	64	case None =>
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	65	require(e.is_insert && e.start == 0)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	66	edit_text(es, commands.insert_after(None, Command.unparsed(e.text)))
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	67	}
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	68	case Nil => commands
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	69	}
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	70	}
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	71
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	72
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	73	/* phase 2: recover command spans */
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	74
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	75	@tailrec def recover_spans(commands: Linear_Set[Command]): Linear_Set[Command] =
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	76	{
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	77	commands.iterator.find(_.is_unparsed) match {
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	78	case Some(first_unparsed) =>
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	79	val first =
38878 1d5b3175fd30 text_edits/recover_spans: reparse at least until line boundary -- increases chance of recovery for bad ML text, for example; wenzelm parents: 38569 diff changeset	80	commands.reverse_iterator(first_unparsed).
1d5b3175fd30 text_edits/recover_spans: reparse at least until line boundary -- increases chance of recovery for bad ML text, for example; wenzelm parents: 38569 diff changeset	81	dropWhile(_.newlines == 0).find(_.is_command) getOrElse commands.head
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	82	val last =
38878 1d5b3175fd30 text_edits/recover_spans: reparse at least until line boundary -- increases chance of recovery for bad ML text, for example; wenzelm parents: 38569 diff changeset	83	commands.iterator(first_unparsed).
1d5b3175fd30 text_edits/recover_spans: reparse at least until line boundary -- increases chance of recovery for bad ML text, for example; wenzelm parents: 38569 diff changeset	84	dropWhile(_.newlines == 0).find(_.is_command) getOrElse commands.last
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	85	val range =
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	86	commands.iterator(first).takeWhile(_ != last).toList ::: List(last)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	87
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	88	val sources = range.flatMap(_.span.map(_.source))
38569 9d480f6a2589 tuned signatures; wenzelm parents: 38425 diff changeset	89	val spans0 = parse_spans(session.current_syntax().scan(sources.mkString))
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	90
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	91	val (before_edit, spans1) =
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	92	if (!spans0.isEmpty && first.is_command && first.span == spans0.head)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	93	(Some(first), spans0.tail)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	94	else (commands.prev(first), spans0)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	95
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	96	val (after_edit, spans2) =
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	97	if (!spans1.isEmpty && last.is_command && last.span == spans1.last)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	98	(Some(last), spans1.take(spans1.length - 1))
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	99	else (commands.next(last), spans1)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	100
38419 f9dc924e54f8 renamed create_id to new_id; wenzelm parents: 38417 diff changeset	101	val inserted = spans2.map(span => new Command(session.new_id(), span))
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	102	val new_commands =
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	103	commands.delete_between(before_edit, after_edit).append_after(before_edit, inserted)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	104	recover_spans(new_commands)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	105
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	106	case None => commands
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	107	}
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	108	}
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	109
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	110
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	111	/* resulting document edits */
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	112
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	113	{
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	114	val doc_edits = new mutable.ListBuffer[Document.Edit[Command]]
38417 b8922ae21111 renamed class Document to Document.Version etc.; wenzelm parents: 38374 diff changeset	115	var nodes = previous.nodes
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	116
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	117	for ((name, text_edits) <- edits) {
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	118	val commands0 = nodes(name).commands
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	119	val commands1 = edit_text(text_edits, commands0)
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	120	val commands2 = recover_spans(commands1) // FIXME somewhat slow
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	121
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	122	val removed_commands = commands0.iterator.filter(!commands2.contains(_)).toList
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	123	val inserted_commands = commands2.iterator.filter(!commands0.contains(_)).toList
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	124
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	125	val cmd_edits =
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	126	removed_commands.reverse.map(cmd => (commands0.prev(cmd), None)) :::
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	127	inserted_commands.map(cmd => (commands2.prev(cmd), Some(cmd)))
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	128
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	129	doc_edits += (name -> Some(cmd_edits))
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	130	nodes += (name -> new Document.Node(commands2))
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	131	}
38419 f9dc924e54f8 renamed create_id to new_id; wenzelm parents: 38417 diff changeset	132	(doc_edits.toList, new Document.Version(session.new_id(), nodes))
38374 7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	133	}
7eb0f6991e25 moved Document.text_edits to Thy_Syntax; wenzelm parents: 38373 diff changeset	134	}
34268 b149b7083236 separate module Thy_Syntax for command span parsing; wenzelm parents: diff changeset	135	}

author	haftmann
	Fri, 03 Sep 2010 16:08:09 +0200
changeset 39121	6f6a9c8abbac
parent 38878	1d5b3175fd30
child 40454	2516ea25a54b
permissions	-rw-r--r--