Antlr中不明确的Lexer规则_Antlr_Antlr4 - Fatal编程技术网

Antlr中不明确的Lexer规则

antlr antlr4

Antlr中不明确的Lexer规则,antlr,antlr4,Antlr,Antlr4,我有一个antlr语法，它有多个与同一个单词匹配的词法规则。在词法分析过程中无法解决这个问题，但通过语法，它就变得毫不含糊了例如： conversion: NUMBER UNIT CONVERT UNIT; NUMBER: [0-9]+; UNIT: 'in' | 'meters' | ......; CONVERT: 'in'; 输入：1英寸（米）单词“in”与lexer规则UNIT和CONVERT相匹配如何在保持语法文件可读性的同时解决此问题？根据您问题中的信息，很难说最好的解决方案

我有一个antlr语法，它有多个与同一个单词匹配的词法规则。在词法分析过程中无法解决这个问题，但通过语法，它就变得毫不含糊了

例如：

conversion: NUMBER UNIT CONVERT UNIT;
NUMBER: [0-9]+;
UNIT: 'in' | 'meters' | ......;
CONVERT: 'in';

输入：

1英寸（米）

单词“in”与lexer规则

UNIT

和

CONVERT

相匹配

如何在保持语法文件可读性的同时解决此问题？

根据您问题中的信息，很难说最好的解决方案是什么-例如，我不知道您的lexer规则是什么-我也无法告诉您为什么有模棱两可的lexer规则

根据我使用antlr的经验，lexer规则通常没有任何语义含义；它们只是与某种正则表达式匹配的文本。因此，我不需要使用

变量

、

方法名

等，而只需要使用

标识符

，然后在更高的层次上进行计算

换句话说，似乎（从我从你的问题中收集到的一点信息）你可以从用语法规则替换

UNIT

和

CONVERT

中获益，或者只使用一条规则：

conversion: NUMBER TEXT TEXT TEXT

以及验证ANTLR listener/tree walker/etc中的文本值

编辑

感谢您使用lexer规则更新您的问题。现在很清楚为什么它失败了——正如BernardK指出的，antlr总是选择第一个匹配的lexer规则。这意味着两个模棱两可的lexer规则中的第二个不可能匹配，这使得您提出的设计不可行

我的观点是lexer规则不是做单元验证之类事情的正确层；他们擅长结构，而不是内容。评估解析树比尝试扭曲antlr语法要实际得多

最后，您还可以对解析规则执行嵌入操作，比如根据一组已知的单元验证ID标记的值。它可以工作，但会破坏语法的可重用性。

根据您问题中的信息，很难说最好的解决方案是什么-例如，我不知道您的lexer规则是什么-我也不知道您为什么有模棱两可的lexer规则

根据我使用antlr的经验，lexer规则通常没有任何语义含义；它们只是与某种正则表达式匹配的文本。因此，我不需要使用

变量

、

方法名

等，而只需要使用

标识符

，然后在更高的层次上进行计算

换句话说，似乎（从我从你的问题中收集到的一点信息）你可以从用语法规则替换

UNIT

和

CONVERT

中获益，或者只使用一条规则：

conversion: NUMBER TEXT TEXT TEXT

以及验证ANTLR listener/tree walker/etc中的文本值

编辑

感谢您使用lexer规则更新您的问题。现在很清楚为什么它失败了——正如BernardK指出的，antlr总是选择第一个匹配的lexer规则。这意味着两个模棱两可的lexer规则中的第二个不可能匹配，这使得您提出的设计不可行

我的观点是lexer规则不是做单元验证之类事情的正确层；他们擅长结构，而不是内容。评估解析树比尝试扭曲antlr语法要实际得多

最后，您还可以对解析规则执行嵌入操作，比如根据一组已知的单元验证ID标记的值。它可以工作，但会破坏语法的可重用性。

当输入匹配两个lexer规则时，ANTLR会选择最长的或第一个，请参阅。根据您的语法，中的

将被解释为单位
，从不转换
，以及规则
conversion: NUMBER UNIT CONVERT UNIT;

无法工作，因为有三个UNIT
令牌：
$ grun Question question -tokens -diagnostics input.txt 
[@0,0:0='1',<NUMBER>,1:0]
[@1,1:1=' ',<WS>,channel=1,1:1]
[@2,2:3='in',<UNIT>,1:2]
[@3,4:4=' ',<WS>,channel=1,1:4]
[@4,5:6='in',<UNIT>,1:5]
[@5,7:7=' ',<WS>,channel=1,1:7]
[@6,8:13='meters',<UNIT>,1:8]
[@7,14:14='\n',<NL>,1:14]
[@8,15:14='<EOF>',<EOF>,2:0]
Question last update 0159
line 1:5 missing 'in' at 'in'
line 1:8 mismatched input 'meters' expecting <EOF>

执行：
$ grun Question question -tokens -diagnostics input.txt 
[@0,0:0='1',<NUMBER>,1:0]
[@1,1:1=' ',<WS>,channel=1,1:1]
[@2,2:3='in',<ID>,1:2]
[@3,4:4=' ',<WS>,channel=1,1:4]
[@4,5:6='in',<ID>,1:5]
[@5,7:7=' ',<WS>,channel=1,1:7]
[@6,8:13='meters',<ID>,1:8]
[@7,14:14='\n',<NL>,1:14]
[@8,15:14='<EOF>',<EOF>,2:0]
Question last update 0132
Quantity 1 in to convert in meters

$grun Question Question-tokens-diagnostics input.txt
[@0,0:0='1',,1:0]
[@1,1:1=''，通道=1,1:1]
[@2,2:3='in'，1:2]
[@3,4:4=''，频道=1,1:4]
[@4,5:6='in'，1:5]
[@5,7:7=''，频道=1,1:7]
[@6,8:13='meters'，1:8]
[@7,14:14='\n'，1:14]
[@8,15:14='',,2:0]
问题最后更新0132
以米为单位换算的1英寸数量

标签可从访问者中规则的上下文中获得，因此很容易区分相同类型的标记。
当输入匹配两个lexer规则时，ANTLR选择最长或第一个，请参阅。根据您的语法，

中的

将被解释为单位
，从不转换
，以及规则
conversion: NUMBER UNIT CONVERT UNIT;

无法工作，因为有三个UNIT
令牌：
$ grun Question question -tokens -diagnostics input.txt 
[@0,0:0='1',<NUMBER>,1:0]
[@1,1:1=' ',<WS>,channel=1,1:1]
[@2,2:3='in',<UNIT>,1:2]
[@3,4:4=' ',<WS>,channel=1,1:4]
[@4,5:6='in',<UNIT>,1:5]
[@5,7:7=' ',<WS>,channel=1,1:7]
[@6,8:13='meters',<UNIT>,1:8]
[@7,14:14='\n',<NL>,1:14]
[@8,15:14='<EOF>',<EOF>,2:0]
Question last update 0159
line 1:5 missing 'in' at 'in'
line 1:8 mismatched input 'meters' expecting <EOF>

执行：
$ grun Question question -tokens -diagnostics input.txt 
[@0,0:0='1',<NUMBER>,1:0]
[@1,1:1=' ',<WS>,channel=1,1:1]
[@2,2:3='in',<ID>,1:2]
[@3,4:4=' ',<WS>,channel=1,1:4]
[@4,5:6='in',<ID>,1:5]
[@5,7:7=' ',<WS>,channel=1,1:7]
[@6,8:13='meters',<ID>,1:8]
[@7,14:14='\n',<NL>,1:14]
[@8,15:14='<EOF>',<EOF>,2:0]
Question last update 0132
Quantity 1 in to convert in meters

$grun Question Question-tokens-diagnostics input.txt
[@0,0:0='1',,1:0]
[@1,1:1=''，通道=1,1:1]
[@2,2:3='in'，1:2]
[@3,4:4=''，频道=1,1:4]
[@4,5:6='in'，1:5]
[@5,7:7=''，频道=1,1:7]
[@6,8:13='meters'，1:8]
[@7,14:14='\n'，1:14]
[@8,15:14='',,2:0]
问题最后更新0132
以米为单位换算的1英寸数量

标签可以从访问者中规则的上下文中获得，因此很容易区分相同类型的令牌。
我在示例中添加了lexer规则，以使其更加清晰。捕获lexer规则中的所有文本并在访问者中手动解析，这会破坏使用Antlr的目的。将lexer规则移动到语法规则会起作用，但会使语法难以阅读：unit:'m'e't'e'r'|我在示例中添加了lexer规则以使其更加清晰。捕获lexer规则中的所有文本并在访问者中手动解析，这会破坏使用Antlr的目的。将lexer规则移动到语法规则会起作用，但会使语法难以阅读：unit:'m'e't'e'r'|




[antlr4]相关文章推荐



                                                        
ANTLR4：输入不匹配
antlr4 
Antlr4 为什么将令牌分配给通道时出错？
antlr4 
如何在ANTLR4中终止Lexer
antlr4 
Antlr4 ANTLR 4 Lexer规则：如何忽略零件？
antlr4 
Antlr4 在ANTLR v4中构建自定义解析树
antlr4 
Antlr4 ANTLR 4如何解析注释
antlr4 
将AST动作翻译重写为ANTLR4
antlr4 
使用PDDL语言的默认ANTLR4语法分析错误
antlr4 
Antlr4 ANTLR似乎混淆了规则
antlr4 
ANTLR4空格问题，将数字与字母分开
antlr4 
为什么结尾括号在我的antlr4语法中无效？
antlr4 
ANTLR4中的标记类型和词汇是什么？
antlr4 
                                       





随机文章推荐



                                                        
Migration 如何在没有WAR/EAR文件的情况下迁移WebSphere应用程序
migrationwebsphere 
Migration Liquibase更改脚本中的属性
migration 
Migration 从0.7到1.0的Cassandra模式
migrationcassandra 
Migration 迁移THREE.js hexplanet demo r58=>；r59
migrationthree.js 
Migration 如何在Fullcalendar 1.6.2中添加翻译？
migrationfullcalendar 
Migration EJB2.1没有'；在jboss 6.3中，不能跨方法调用保留状态
migration 
Migration 如何使用“runc”执行容器的实时迁移`
migration 
Migration Salesforce连接器和批处理作业如何使它们以分页方式工作，最好的方法是什么？
migrationsalesforce


                                        

                                        
                                        


                                                
                                                        [antlr]相关推荐
                                                        
Antlr 在AntlWorks中忽略空白
									Antlr
							 
ANTLR语法和语法谓词中的左值意识
									Antlr
							 
Antlr错误'；在character'上没有可行的替代方案；
									Antlr
							 
Antlr 如何更改表达式以强制调用生成的解析器中的RewriteRuleSubtreeStream.NextTree（）？
									Antlr
							 
ANTLR 4树注入/重写运算符
									Antlr
							 									Antlr4
							 
ANTLR是否有unicode标识符开始和标识符继续字符集的内置规则？
									Antlr
							 
是否有bison yacc到ANTLR的转换器可用
									Antlr
							 
ANTLR测试类未编译？
									Antlr
							 
ANTLR 3：将值传递给Lexer（C目标）
									Antlr
							 
Antlr 在分析过程中检测分析错误
									Antlr
							 									Antlr4
							 
Antlr 令牌匹配，但它不应该'；T
									Antlr
							 									Antlr4
							 
“ANTLR模式”；第1行：9无关输入''；期望词；
									Antlr
							 
ANTLR4意外的解析行为
									Antlr
							 									Antlr4
							 
如何从整个ANTLR AST树中切片子树？
									Antlr
							 									Antlr4
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Menu
Sql Server 2008
Exchange Server
D
Jira
Terminal
Magento2
Iis 7
Single Sign On
Jquery Mobile
Flutter
Windows Mobile
Liferay
Map
Sharepoint 2010
Tridion
Webstorm
Asp.net
Keyboard
Ios5
Pycharm
X86
Google Apps Script
Stripe Payments
Entity Framework
Blockchain
Http
Sed
Actions On Google
Uitableview
Parsing
Ruby On Rails 4
Security
Wix
Ms Office
Xamarin.android
Parse Platform
R
Testng
Html5 Canvas
Biztalk
Asterisk
Cloud
Ide
Printing
Virtual Machine
Xpath
Mariadb
Ibm Mobilefirst
Karate
Nativescript
Recursion
Log4net
Vector
Javascript
Sparql
Web Crawler
Android Fragments
Vbscript
Magento
Cypress
Server
Object
Compression
Android Studio
Image Processing
Virtualbox
Cloud Foundry
Xamarin.ios
Deployment
Julia
Rxjs
Microservices
File Upload
Actionscript
Sbt
Jvm
Google Calendar Api
Mongoose
Jpa
Jupyter Notebook
Isabelle
Teradata
Nginx
Localization
Db2
Notepad++
Identityserver4
Iframe
Udp
Libgdx
Asp.net Mvc 4
Azure Service Fabric
Gruntjs
Shopify
Dependencies
Xslt
EmptyTag
Outlook
Wolfram Mathematica
Mapping
Git
Oracle Apex
Coq
Blazor
Processing
Drupal
Asp.net Mvc
Google Maps Api 3
Svg
Centos
Chart.js
Vue.js
Web Services
Wso2
Teamcity
Visual Studio 2008
Memory Management
Smtp
Domain Driven Design
Cobol
Activemq
Ssh
Unix
Push Notification
Content Management System
Documentation
Windbg
Doctrine Orm
Doxygen
Unicode
Pip
Openssl
Permissions
Apache Pig
Nuget
Prolog
Vb.net
Migration
Nhibernate
Sprite Kit
Architecture
Geolocation
Keycloak
Listview
Email
Testing
Acumatica
Jquery Plugins
Java 8
Reflection
Jekyll
Open Source
Selenium Webdriver
Netty
Kdb
Video Streaming
Elm
Vaadin
Google Colaboratory
Jsf 2
Database Design
Raspberry Pi
Intellij Idea
Amazon S3
Fluent Nhibernate
Neo4j
Visual Studio
Clojure
Tags
Three.js
Transactions
Lambda
Zend Framework
Racket
Discord.py
Material Ui
Workflow
Configuration
Frameworks
Ms Access
Caching
Command Line
Windows Phone 8.1
Mqtt
Batch File
Telegram
Logic
Ssl
Sdk
String
Authentication
Antlr
Encoding
Gitlab
Winforms
Akka
Silverlight
Parallel Processing
View
Hadoop


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网