Python 读取文本文件并提取制表符和空间轮廓部分

Python 读取文本文件并提取制表符和空间轮廓部分,python,Python,我有一个文本文件,其格式如下: 1 1089874 108992 PCCW's chief operating officer. Current Chief Operating Officer Mike. 1 3019446 3019327 The world's two largest. late summer sales frenzy caused more of an industry backlash than expected. 为了明确起见,有一个标签(1)

我有一个文本文件,其格式如下:

1   1089874  108992  PCCW's chief operating officer.    Current Chief Operating Officer Mike.
1   3019446 3019327 The world's two largest.    late summer sales frenzy caused more of an industry backlash than expected.
为了明确起见,有一个标签(1)+由制表符+id1(1089874)分隔+由空格+id2(1089925)分隔+由空格+text1+由制表符+text2分隔


我想阅读文本文件并在python的不同列表中提取
标签
text1
text2
。我该怎么做呢?谢谢

假设您的每一行都是一个变量
,只需执行以下操作:

或者,重新阅读您的需求,我认为您实际上想要:

cols = line.split('\t')
label = cols[0]
text1 = ' '.join(cols[1].split()[2:])
text2 = cols[2]

您好@GoliA,欢迎来到StackOverflow,您可以查看以改进此问题和未来的问题。特别是你应该提供一些和/或一些代码,以证明你已经尝试自己解决问题。你是否缺少一些
。加入那里的
s?:)非常感谢。除了第三行,其余的都可以。
cols = line.split('\t')
label = cols[0]
text1 = ' '.join(cols[1].split()[2:])
text2 = cols[2]