Nlp 使用NLTK的分块/文本解析

Nlp 使用NLTK的分块/文本解析,nlp,text-parsing,nltk,Nlp,Text Parsing,Nltk,我试着解析一些文本并绘制图表,就像你在写一个句子一样。我是NLTK的新手,我正试图在NLTK中找到一些可以帮助我实现这一目标的东西。到目前为止,我已经看到了nltk.ne_chunk和nltk.pos_标签。我发现他们不是很有帮助,我无法找到任何好的在线文档 我也尝试过使用Lancaster词干分析器,但我不完全理解它的功能、应该如何使用,甚至不理解它存在的原因 有人能帮我解决这个问题吗?没有任何指示灯,我真的很茫然,也很沮丧 提前感谢您所描述的实际上是一项非常艰巨的任务,因为归根结底,您的程序

我试着解析一些文本并绘制图表,就像你在写一个句子一样。我是NLTK的新手,我正试图在NLTK中找到一些可以帮助我实现这一目标的东西。到目前为止,我已经看到了
nltk.ne_chunk
nltk.pos_标签
。我发现他们不是很有帮助,我无法找到任何好的在线文档

我也尝试过使用
Lancaster词干分析器
,但我不完全理解它的功能、应该如何使用,甚至不理解它存在的原因

有人能帮我解决这个问题吗?没有任何指示灯,我真的很茫然,也很沮丧


提前感谢

您所描述的实际上是一项非常艰巨的任务,因为归根结底,您的程序是否成功完全是主观的衡量标准。在这种情况下,通常意味着构建一个解决问题的程序是困难的。在大学里,有人因为解决这些问题而获得报酬

如果您想尝试一下,我建议您尝试使用某种自动词法分析工具,而不是尝试手动解析和注释,然后利用您的解析树。解析树通常表示句法分析,即句子的结构。另一方面,你关心的是语义分析,即它的意思——或者至少是两个句子是相似的还是不同的(这实际上比某个东西的意思要简单一点)


您可以查看一些现成的自动摘要工具。这些方法试图根据句子对文本的重要性对句子进行评分,并筛选出重要性低于指定阈值的句子。这并不是说这对你有多大帮助,因为你仍然有需要合并摘要的问题

你到底想完成什么?你真的需要语义分析,还是简单的词法分析?你想要生成的digram是什么?最终,我希望能够创建一个代表文本中数据的“树”。一旦我完成了这项工作,我就可以对另一篇课文(关于同一主题——比如一堂课)做同样的工作,比较两者的相似之处/不同之处,并将差异纳入其中。这最终会产生一棵“树”,它能最准确地表达你的想法。现在,我正在尝试获取一个句子的句法结构,以便以后可以进行语义分析。请告诉我我是否走错了方向,因为我仍然是一名学生,不是一名专家,我希望得到这样的反馈。在这两种情况下,您会推荐任何特定的nltk工具/模块来帮助完成这项任务吗?如果我尝试完成这项任务,我不确定我是否会费心解析。我认为你最好使用一种统计方法,这种方法通常使用一堆单词的方法(或类似的方法)。这就是它听起来的样子,只是把每个句子当作一堆单词,而不必担心单词的位置。一些可能帮助您的技术是基于集群的方法,可能还有TF-IDF。也许读一下这些,看看你是否认为它们对你有帮助。NLTK有这两个模块。谢谢你。但是,您是否可以向我指出任何特定的nltk模块?也许你用过的东西,你认为可能适合我的问题?