Nlp 对于对自然语言处理感兴趣的人来说,什么是好的起点? 问题:

Nlp 对于对自然语言处理感兴趣的人来说,什么是好的起点? 问题:,nlp,dcg,Nlp,Dcg,因此,我最近提出了一些可能的新项目,这些项目必须处理从用户提交和生成的文本中获得“意义”的问题 是处理这类问题的领域,经过一些初步研究,我发现了与大学的合作。而且stackoverflow已经成功了 如果有人能把我和一些好的资源联系起来,从研究论文、介绍文字到API,我会比一个6岁的孩子打开他的圣诞礼物更快乐 更新 通过你的一条建议,我发现了“世界上最大、最完整的常识库和常识推理引擎”。更令人惊奇的是,有一个项目是opencyc的一个提炼版本,名为。它以rdf/owl/skos n3语法的语义数

因此,我最近提出了一些可能的新项目,这些项目必须处理从用户提交和生成的文本中获得“意义”的问题

是处理这类问题的领域,经过一些初步研究,我发现了与大学的合作。而且stackoverflow已经成功了

如果有人能把我和一些好的资源联系起来,从研究论文、介绍文字到API,我会比一个6岁的孩子打开他的圣诞礼物更快乐

更新 通过你的一条建议,我发现了“世界上最大、最完整的常识库和常识推理引擎”。更令人惊奇的是,有一个项目是opencyc的一个提炼版本,名为。它以rdf/owl/skos n3语法的语义数据为特征

我还偶然发现了一个解析器生成器,用于“根据语法描述构造识别器、解释器、编译器和翻译器”

我这里有一个问题,列出了很多


谢谢你的社区

你可以试着读一读,这基本上是许多语言处理背后的数学基础。它实际上并没有那么重,主要基于集合论和图论。很多月前,我在离散数学课程中学习了它,我想在这个阶段有很多很好的参考资料


编辑:虽然看起来像是一个很好的学习资源,但没有我在谷歌上期望的那么多。

NLP的早期探索者之一是诺姆·乔姆斯基;他在50年代到70年代写了一些关于这个主题的小书。你可能会发现这种引人入胜的阅读方式。

Cycorp对他们的Cyc知识库是如何从句子中获得意义有着深刻的认识


通过利用大量常见事实的知识库,该系统可以确定一个句子最符合逻辑的语法分析。

很难说,NLP是一个比大多数人想象的更广泛的领域。基本上,语言可以分为几个类别,这需要你学习完全不同的东西

在我开始之前,让我告诉你,如果没有某个(密切相关的)领域的学位,我怀疑你是否会取得显著的成功(至少作为一名专业人士)。涉及到很多理论,其中大部分都是枯燥乏味的东西,很难学习。你需要很大的耐力,最重要的是:时间

如果你对文本的意思感兴趣,那么,这就是下一件大事。语义搜索引擎预计将启动Web3.0,但我们还远远没有做到这一点。从文本中提取逻辑取决于几个步骤:

  • 标记化、分块
  • 在词汇层面上消除歧义(时间像箭一样飞逝,但水果像香蕉一样飞逝。)
  • 句法分析
  • 形态分析(时态、体、格、数等)
一张小单子,从我头上掉下来的。还有更多:-),每一点都有更多的细节。例如,当我说“解析”时,这是什么?有许多不同的解析算法,也有同样多的解析形式。其中最强大的是和。但这两种技术目前都很少在该领域使用。通常情况下,你需要处理一些不成熟的生成方法,并且必须自己进行形态学分析

从这里到语义学是一大步。语法/语义接口取决于所采用的语法和语义框架,目前还没有单一的工作解决方案。在语义方面,有经典的生成语义,还有,还有更多。即使是所有事物所基于的逻辑形式主义,也仍然没有得到很好的定义。有人说应该使用一阶逻辑,但这似乎不够;还有蒙塔古使用的内涵逻辑,但这似乎过于复杂,在计算上不可行。还有动态逻辑(Groenendijk和Stokhof是这方面的先驱。很棒的东西!)最近,今年夏天,实际上,提出了一种新的形式主义,好奇语义学,也很有趣

如果你想从一个非常简单的层面开始,请阅读,这是一个很棒的东西,事实上是对计算语义的介绍!我最近扩展了他们的系统,以涵盖问题的划分理论(问答是一种野兽!),正如Groenendijk和Stokhof(1982)所提出的那样,但不幸的是,该理论在个人领域的复杂性为O(n²)。在这样做的时候,我发现B&B的实现在某些地方有点,呃……黑客。尽管如此,它将真的,真的帮助你深入研究计算语义,它仍然是一个非常令人印象深刻的展示可以做什么。此外,他们应该为实现低俗小说(电影)中的语法而获得额外的酷分


当我在做的时候,拿起序言。许多计算语义学的研究都是基于Prolog的。这是一个很好的介绍。我还可以推荐“Prolog的艺术”和Covington的“Prolog深度编程”以及“Prolog程序员的自然语言处理”,前者可以在网上免费获得。

从构建块开始,一个更简单的地方是查看文档,找到一个试图实现这一点的包。我推荐Python[自然语言工具包(NLTK)”,特别是因为它有很多例子,它不会让你完全得到你想要的(这是一个AI难题),但它会给你一个很好的基础。NLTK有解析器、分块器、上下文无关语法等等。

史蒂文·平克(Steven Pinker)的《语言本能》(Language Institute)是一篇非常有趣的易读介绍。它深入了乔姆斯基(Chomsky)的内容,还从进化生物学的角度讲述了一些有趣的故事。也许值得在此之前从类似的内容开始如果你对这门学科不熟悉的话,你可以深入研究乔姆斯基的论文和相关工作。

这真的是一件很难的事