如何使用python从.txt文件中提取段落?

如何使用python从.txt文件中提取段落?,python,extraction,paragraph,Python,Extraction,Paragraph,我需要从.txt文件中提取段落,其中每个段落都以字母Abstract开头,如下所示 摘要:大规模多输入多输出天线系统、毫米波通信和超密集网络已被广泛视为 促进5G开发和部署的三大关键因素 系统。我们提出了一种灵活、快速部署、跨层的人工智能系统 基于智能(AI)的框架,以满足当前和未来的需求 5G及以上基础设施。我们给出了支持AI的5G用例示例 适应重要的5G特定功能,并讨论人工智能的价值 支持超越5G网络的演进 摘要:无线革命已经从第五代(5G)无线网络的特定愿景、总体目标和首个正式3GPP发

我需要从.txt文件中提取段落,其中每个段落都以字母Abstract开头,如下所示

摘要:大规模多输入多输出天线系统、毫米波通信和超密集网络已被广泛视为 促进5G开发和部署的三大关键因素 系统。我们提出了一种灵活、快速部署、跨层的人工智能系统 基于智能(AI)的框架,以满足当前和未来的需求 5G及以上基础设施。我们给出了支持AI的5G用例示例 适应重要的5G特定功能,并讨论人工智能的价值 支持超越5G网络的演进


摘要:无线革命已经从第五代(5G)无线网络的特定愿景、总体目标和首个正式3GPP发布开始。尽管发展了几种现代通信技术,但从现代数字通信时代开始,我们主要通过改变正弦载波信号的振幅、相位或频率来传输信息,这有其固有的缺点。另一方面,指数调制(IM)提供传输数字信息的另一个维度:相应通信系统构建块的索引


摘要:安全性是旨在利用蜂窝(C)服务将车辆连接到所有设备(V2X)的网络的主要关注点。目前,C-V2X正在观察从长期演进(LTE)演进的通用地面无线接入网(E-UTRAN)到基于第五代(5G)的功能架构的范式转变。然而,安全性和凭证管理仍然是5G-V2X下需要解决的问题



如何使用python脚本实现这一点?

我假设每个段落都由新行分隔。如果是这样,您可以使用
splitlines()

如果需要,可以删除“摘要:”如下所示:

lines2 = [i[len("Abstract: ")] for i in lines]

我假设每个段落都用新行隔开。如果是这样,您可以使用
splitlines()

如果需要,可以删除“摘要:”如下所示:

lines2 = [i[len("Abstract: ")] for i in lines]
像这样:

with open("./abstract.txt", "r") as f:
    for line in f:
        print(line)
这里发生了什么

我们正在创建一个上下文管理器(
with
),用于管理文件处理程序。这可以防止在我们完成时将文件保持打开状态,以及其他令人头痛的问题。我们将其分配给
f
,并将
分配为f
。“模式”是纯读,参数为
open
as
“r”

然后,我们的
f
是一个类似于“文件”的对象,它是可编辑的,因此我们可以对
循环执行类似
的列表操作,并使用它进行列表理解。每一行都是一个字符串,我们可以对它执行字符串操作,就像@bunbun的优秀答案中所示。

类似这样:

with open("./abstract.txt", "r") as f:
    for line in f:
        print(line)
这里发生了什么

我们正在创建一个上下文管理器(
with
),用于管理文件处理程序。这可以防止在我们完成时将文件保持打开状态,以及其他令人头痛的问题。我们将其分配给
f
,并将
分配为f
。“模式”是纯读,参数为
open
as
“r”


然后,我们的
f
是一个类似于“文件”的对象,它是可编辑的,因此我们可以对
循环执行类似
的列表操作,并使用它进行列表理解。每一行都是一个字符串,我们可以对它执行字符串操作,就像@bunbun的优秀答案中所示。

实际上每一行本身就是一个新行,因此splitlines()将不会有帮助。它与您的示例中的情况不同。如果它不准确,请编辑您的示例以获得正确的输入。实际上,每一行本身就是一个新行,因此splitlines()将不会有帮助。它与您的示例中的情况不同。如果不准确,请编辑您的示例以获得正确的输入