Parsing 英语有正式语法吗?

Parsing 英语有正式语法吗?,parsing,nlp,Parsing,Nlp,我正在浏览网页搜索英语语法,但我只找到了几个简单的例子,如: s -> np vp np -> det n vp -> v | v np det -> 'a' | 'the' n -> 'woman' | 'man' v -> 'shoots' 也许我没有意识到这个问题有多大,因为我认为语法已经正式化了。有谁能为我提供一些扩展的正式英语语法的来源吗?这将是一个巨大的挑战。可能不可能 人类语言是由“模拟”生物(通常)以一种非常宽容的方式解释的,而不是由能坚持

我正在浏览网页搜索英语语法,但我只找到了几个简单的例子,如:

s -> np vp
np -> det n
vp -> v | v np
det -> 'a' | 'the'
n -> 'woman' | 'man'
v -> 'shoots' 

也许我没有意识到这个问题有多大,因为我认为语法已经正式化了。有谁能为我提供一些扩展的正式英语语法的来源吗?

这将是一个巨大的挑战。可能不可能

人类语言是由“模拟”生物(通常)以一种非常宽容的方式解释的,而不是由能坚持遵守规则的愚蠢的数字机器解释的。它们确实倾向于有某种潜在的结构,但例外情况比比皆是。实际上,唯一的“规则”是让别人能够理解你

即使在生物语言中,英语也可能是最糟糕的选择,因为它有着悠久的历史。它开始时可能是各种不同日耳曼语言的混合体(经过刻意简化),然后在诺曼征服后覆盖了大量法语,然后几乎世界上所有语言的比特和字母都移植到了它上面

让我们来了解一下我们正在讨论的音阶,假设我们可以把字典看作是人类语言的终端列表。只有一项主要的工作能使英语的综合性达到可以接受的程度,这项工作包含了超过50万个条目。然而,很少有人知道超过十分之一的人。这意味着,如果你从《牛津英语词典》中随机挑选单词并用它们造句,大多数说英语的人甚至都很难将结果识别为英语


不同的演讲者群体往往也知道不同的词集。因此,几乎每一位语言使用者都学会了根据他们的受众定制他们的词汇表(使用过的终端列表)。我对来自“错误的一方”的朋友的讲话与我对家人的讲话大不相同,也与我在这里的讲话大不相同。

你可能想看看诺姆·乔姆斯基和跟随他的人的工作。我相信他的大部分工作都是关于语言的生成属性的。查看维基百科上的文章以了解更多详细信息。

查看,您可以使用LKB或标准的非电子资源。

查看控制英语的尝试:

不完美,肯定不完整,从理论角度来看不理想。但我发现的最好的语法是:

考虑所有可能的单词的完整语法可能并不存在。然而,在任何情况下,在句法层面上建立一个通用的语言模型都更有意义。是的,英语有一个正式的语法,但有一个大问题:它是模棱两可的。同一个句子可能意味着不同的东西,这取决于你如何解析它。说英语的人根据上下文选择正确的解释。想想双关语。他们通过使用歧义来工作。这个问题的更好答案可以在感谢编辑处找到,我今天的拼写显然不正确。虽然没有完全回答他的问题,但我衷心同意他应该仔细阅读乔姆斯基的文章,所以+1。这个答案似乎混淆了语法和语义。对词义的了解使你1)增强了解决歧义的能力,2)从语言中排除非感官句子的能力(无色绿色的想法会让你睡得很香)。这些都不是指定排除无效句子的综合语法所必需的。@SigmaX-你的终端列表(你的词素)是语法固有的一部分。例如,考虑“Jesus哭”和“逃跑”这两个句子。如果不知道这些词的定义,就无法知道第一个词是名词,第二个词是副词,而我们甚至不知道在大多数情况下,动词副词在英语中是非法的,这是一种特殊情况(称为“命令式”,通过引入在大多数情况下都不允许的隐含主语的概念而被弱化)。我试图通过展示最基本的步骤,提出一个详尽的、一致的终端列表,来避免解释所有这些混乱。也许除了乔姆斯基之外,真正需要咨询这个问题的人是。计算机语言倾向于通过在完备性上妥协来回避不完备性问题。可能有一些有用的东西很难用它们来表达,但它们是相当一致的,因此您可以为它们创建漂亮的语法。人类语言走了另一条路,在一致性上妥协了。这对人类来说没什么大不了的,因为我们宁愿能够写出和理解伟大的诗歌,也不愿一直被100%正确地理解time@SigmaX-我不完全确定你的例子是否“非理性”。在正确的语境中(有正确的句子或作者和读者之间正确的知识共享),“无色的绿色想法”很容易成为某种东西的隐喻。毕竟,“绿色”可能意味着“没有经验”,“无色”可能意味着“无聊”,“睡眠”有很多隐喻意义。我读过乔伊斯(对我)来说意义不大的段落。