使用Python从子字符串中提取特定字符串

使用Python从子字符串中提取特定字符串,python,string,search,split,Python,String,Search,Split,我有一个大文档,我正试图使用Pythonv3从中提取某些数据。重复类似于下面的文本,每次识别“pic=”和“originalName=”字符串时,我都要提取“123456789”和“987654321” “这是一些文本pic=123456789一些其他文本originalName=“987654321.jpg然后是一些其他文本” 有人能帮忙吗?你可以试试这个: import re s= 'this is some text pic=123456789 some more text origina

我有一个大文档,我正试图使用Pythonv3从中提取某些数据。重复类似于下面的文本,每次识别“pic=”和“originalName=”字符串时,我都要提取“123456789”和“987654321”

“这是一些文本pic=123456789一些其他文本originalName=“987654321.jpg然后是一些其他文本”

有人能帮忙吗?

你可以试试这个:

import re
s= 'this is some text pic=123456789 some more text originalName="987654321.jpg then some more text'
data = re.findall('(?<=pic\=)\d+|(?<=originalName\=\")\d+', s)

您将需要使用python的库进行。正则表达式是搜索文本中模式的有用方法。在本例中,其他注释者已经提供了一个可用的代码段:

import re
s= 'this is some text pic=123456789 some more text originalName="987654321.jpg then some more text'
data = re.findall('(?<=pic\=)\d+|(?<=originalName\=\")\d+', s)
重新导入
s='这是一些文本pic=123456789一些更多的文本originalName=“987654321.jpg然后是一些更多的文本'

data=re.findall(')(?听起来你想要正则表达式。
data=re.findall(')(?我建议你开始在答案上投入更多的精力,而不是“试试这个”…你不想让OP了解他们在运行什么吗?他们显然没有使用正则表达式的经验。谢谢!非常有意义。我如何在其中添加字符?我刚刚意识到我的一些原始名称也有字母。再次感谢
import re
s= 'this is some text pic=123456789 some more text originalName="987654321.jpg then some more text'
data = re.findall('(?<=pic\=)\d+|(?<=originalName\=\")\d+', s)