连接Python中re.findall找到的字符串_Python

连接Python中re.findall找到的字符串

python

连接Python中re.findall找到的字符串,python,Python,用搜索栏从网站上抓取数据我正在使用python进行搜索，然后对搜索结果进行过滤，以查找“像这样的词”：问题是，我试图获取的数据有时是多个单词，例如“Item Number One”，但re.findall显示为“Item”“Number”“One” 我希望将数据的原始形式保留为一个短语，但我不确定如何告诉python将它们组合在一起 [A-Z][A-Z]单词的短语在页面上总是相互隔离的，因此我想知道是否可以检查这些单词旁边的字符是否也是[A-Z][A-Z]，如果是，将它们分组在一起有什么建

用搜索栏从网站上抓取数据

我正在使用python进行搜索，然后对搜索结果进行过滤，以查找

“像这样的词”

：

问题是，我试图获取的数据有时是多个单词，例如“Item Number One”，但re.findall显示为

“Item”“Number”“One”

我希望将数据的原始形式保留为一个短语，但我不确定如何告诉python将它们组合在一起

[A-Z][A-Z]单词的短语在页面上总是相互隔离的，因此我想知道是否可以检查这些单词旁边的字符是否也是

[A-Z][A-Z]

，如果是，将它们分组在一起

有什么建议吗？

两种不同的方法：

将正则表达式更改为搜索多个单词

将正则表达式结果重新连接到字符串中

对于（1），您可以尝试以下操作：

tabOne = re.findall(r"((?:[A-Z][a-z]*\s?)+)", str(initialFilter))

tabOne = re.findall(r"[A-Z][a-z]*", str(initialFilter))
results = ' '.join(tabOne)

对于（2），您可以执行以下操作：

tabOne = re.findall(r"((?:[A-Z][a-z]*\s?)+)", str(initialFilter))

tabOne = re.findall(r"[A-Z][a-z]*", str(initialFilter))
results = ' '.join(tabOne)

抱歉，在我发布之前没有测试我的正则表达式。我马上就修好。