Nlp 如何使用nltk从文本/pdf中提取段落?

Nlp 如何使用nltk从文本/pdf中提取段落?,nlp,nltk,Nlp,Nltk,我想从一个大的文本文件中提取段落,基本思想是提取pdf的每个部分,我知道以下几点: 每个部分都以7.1、7.2等数字开始,所以我想提取7.2之前属于7.1的所有文本,同样地,如果我提取世界7.3第一次出现之前的所有文本,减去7-1,它将得到7.2。那么在nltk中有什么方法可以做到这一点吗?你找到解决方案了吗?@DeepanRaj不,不幸的是,我没有找到。

我想从一个大的文本文件中提取段落,基本思想是提取pdf的每个部分,我知道以下几点:
每个部分都以7.1、7.2等数字开始,所以我想提取7.2之前属于7.1的所有文本,同样地,如果我提取世界7.3第一次出现之前的所有文本,减去7-1,它将得到7.2。那么在nltk中有什么方法可以做到这一点吗?

你找到解决方案了吗?@DeepanRaj不,不幸的是,我没有找到。