Python 3.x 基于关键词的熊猫信息提取
我尝试使用以下条件从行中提取部分文本:Python 3.x 基于关键词的熊猫信息提取,python-3.x,pandas,Python 3.x,Pandas,我尝试使用以下条件从行中提取部分文本: df['output'] = df['subject'].str.split('Class : ').str[1] 上面的代码工作得很好,但是如果行有多个Class值,我如何修改它以提取最后一个值 例如: subject, output Class Name : Science, Science Class : Class Assigned Class : Math, Class Assigned Class : Math 我如何更改代码以修复第二行的
df['output'] = df['subject'].str.split('Class : ').str[1]
上面的代码工作得很好,但是如果行有多个Class
值,我如何修改它以提取最后一个值
例如:
subject, output
Class Name : Science, Science
Class : Class Assigned Class : Math, Class Assigned Class : Math
我如何更改代码以修复第二行的输出,其中预期的输出是
Math
,但由于单词Class
多次出现,它从第一次出现时就获取了。您的示例非常混乱,因为它并没有真正实现您所描述的内容或示例代码的功能。第一行根本不拆分,因为拆分条件“Class:”
从未出现,第二行拆分的方式与您显示的方式不同-它在列表的元素1中输出“Class Assigned”
这就是说,只需使用[-1]进行索引,第二行就可以将Math
作为输出。也许,split(“:”)[-1]