Ocaml 获取在解析器内引发解析错误的输入字符串

Ocaml 获取在解析器内引发解析错误的输入字符串,ocaml,ocamlyacc,menhir,Ocaml,Ocamlyacc,Menhir,我有一个用menhir编写的前端,它试图解析一个表达式:从字符串到表达式。前端Parser_e.main的入口点在我的OCaml代码中的几个不同位置被调用。因此,我希望能够捕获前端内部而不是外部可能出现的错误。捕获错误时,我要显示的一个特别重要的信息是前端无法解析的整个输入字符串。(lexer的错误非常罕见,因为前端几乎可以读取所有内容) 所以我试着跟随,并在出现错误时打印更多信息。在parser_e.mly中,我添加了 exception LexErr of string exception

我有一个用
menhir
编写的前端,它试图解析一个表达式:从字符串到表达式。前端
Parser_e.main
的入口点在我的OCaml代码中的几个不同位置被调用。因此,我希望能够捕获前端内部而不是外部可能出现的错误。捕获错误时,我要显示的一个特别重要的信息是前端无法解析的整个输入字符串。(lexer的错误非常罕见,因为前端几乎可以读取所有内容)

所以我试着跟随,并在出现错误时打印更多信息。在
parser_e.mly
中,我添加了

exception LexErr of string
exception ParseErr of string

let error msg start finish  = 
  Printf.sprintf "(line %d: char %d..%d): %s" start.pos_lnum 
       (start.pos_cnum - start.pos_bol) (finish.pos_cnum - finish.pos_bol) msg

let parse_error msg nterm =
  raise (ParseErr (error msg (rhs_start_pos nterm) (rhs_end_pos nterm)))

e_expression:
/* empty */ { EE_empty }
| INTEGER { EE_integer $1 }
| DOUBLE { EE_double $1 }
...
| error { parse_error "e_expression" 1; ERR "" }

但是它仍然没有输入字符串作为信息。有人知道我是否缺少任何函数来获取该信息吗?

在出现错误的情况下,您可以使用
解析.symbol\u start\u pos
解析.symbol\u end\u pos
函数,以两个位置的格式提取失败词素的位置。不幸的是,
解析
模块并没有真正提供对词素的字符串访问,但如果输入存储在文件中,则可以手动提取它或以编译器样式打印错误,IDE将手动理解并突出显示它。下面是模块
Parser\u错误
。它定义函数
Parser\u error.throw
,该函数将引发
Parser\u error.T
异常。异常会破坏诊断消息和故障词素的位置。提供了几个方便的函数来从文件中提取这个词素,或者生成fileposition消息。如果输入未存储在文件中,则可以使用exn的
string\u
函数将输入作为字符串和
Parser\u error.T
异常接受,并从中提取有问题的子字符串。这是使用此异常进行错误报告的解析器的示例

open Lexing

(** T(message,start,finish) parser failed with a [message] on an 
    input specified by [start] and [finish] position.*)
exception T of (string * position * position)

(** [throw msg] raise a [Parser_error.T] exception with corresponding
    message. Must be called in a semantic action of a production rule *)
let throw my_unique_msg =
  let check_pos f = try f () with _ -> dummy_pos in
  Printexc.(print_raw_backtrace stderr (get_raw_backtrace ()));
  let sp = check_pos Parsing.symbol_start_pos in
  let ep = check_pos Parsing.symbol_end_pos  in
  raise (T (my_unique_msg,sp,ep))

(** [fileposition start finish] creates a string describing a position 
    of an lexeme specified by [start] and [finish] file positions. The
    message has the same format as OCaml and GNU compilers, so it is
    recognized by most IDE, e.g., Emacs. *)
let fileposition err_s err_e =
  Printf.sprintf
    "\nFile \"%s\", line %d, at character %d-%d\n"
    err_s.pos_fname err_s.pos_lnum err_s.pos_cnum err_e.pos_cnum

(** [string_of_exn line exn] given a [line] in a file, extract a failed 
    lexeme form the exception [exn] and create a string denoting the  
    parsing error in a format similar to the format used by OCaml 
    compiler, i.e., with fancy underlying. *) 
let string_of_exn line (msg,err_s,err_e) =
  let b = Buffer.create 42 in
  if err_s.pos_fname <> "" then
    Buffer.add_string b (fileposition err_s err_e);
  Buffer.add_string b
    (Printf.sprintf "Parse error: %s\n%s\n" msg line);
  let start = max 0 (err_s.pos_cnum - err_s.pos_bol)  in
  for i=1 to start  do
    Buffer.add_char b ' '
  done;
  let diff = max 1 (err_e.pos_cnum - err_s.pos_cnum) in
  for i=1 to diff do
    Buffer.add_char b '^'
  done;
  Buffer.contents b

(** [extract_line err] a helper function that will extract a line from 
     a file designated by the parsing error exception *)
let extract_line err =
  let line = ref "" in
  try
    let ic = open_in err.pos_fname in
    for i=0 to max 0 (err.pos_lnum - 1) do
      line := input_line ic
    done;
    close_in ic;
    !line
  with exn -> !line

(** [to_string exn] converts an exception to a string *)
let to_string ((msg,err,_) as exn) =
  let line = extract_line err in
  string_of_exn line exn

给定一个字符串行作为输入,函数返回引起错误的精确子字符串,而我问的是如何显示整个输入字符串。但我认为我最初的问题很简单:我们可以围绕
Parser_e.main
Parse.statement
来包装错误处理,并始终调用包装器。。。很高兴知道您的示例和模块哪个更精确……这是不可能的,因为解析器本身并不知道。在故障时刻,它发现自己处于一种不再有转换的状态。不会存储它如何在这种状态下结束的历史记录。您可以启用调试模式,并打印此历史记录,但这不同于为最终用户生成漂亮的解析器错误。
let parse_command line =
  try
    let lbuf = Lexing.from_string line in
    `Ok Parser.statement Lexer.tokens lbuf
  with
  | Parsing.Parse_error -> `Fail "Parse error"
  | Parser_error.T exn -> `Fail (Parser_error.string_of_exn line exn)