连接Python中re.findall找到的字符串

连接Python中re.findall找到的字符串,python,Python,用搜索栏从网站上抓取数据 我正在使用python进行搜索,然后对搜索结果进行过滤,以查找“像这样的词”: 问题是,我试图获取的数据有时是多个单词,例如“Item Number One”,但re.findall显示为“Item”“Number”“One” 我希望将数据的原始形式保留为一个短语,但我不确定如何告诉python将它们组合在一起 [A-Z][A-Z]单词的短语在页面上总是相互隔离的,因此我想知道是否可以检查这些单词旁边的字符是否也是[A-Z][A-Z],如果是,将它们分组在一起 有什么建

用搜索栏从网站上抓取数据

我正在使用python进行搜索,然后对搜索结果进行过滤,以查找
“像这样的词”

问题是,我试图获取的数据有时是多个单词,例如“Item Number One”,但re.findall显示为
“Item”“Number”“One”

我希望将数据的原始形式保留为一个短语,但我不确定如何告诉python将它们组合在一起

[A-Z][A-Z]单词的短语在页面上总是相互隔离的,因此我想知道是否可以检查这些单词旁边的字符是否也是
[A-Z][A-Z]
,如果是,将它们分组在一起

有什么建议吗?

两种不同的方法:

  • 将正则表达式更改为搜索多个单词
  • 将正则表达式结果重新连接到字符串中
  • 对于(1),您可以尝试以下操作:

    tabOne = re.findall(r"((?:[A-Z][a-z]*\s?)+)", str(initialFilter))
    
    tabOne = re.findall(r"[A-Z][a-z]*", str(initialFilter))
    results = ' '.join(tabOne)
    
    对于(2),您可以执行以下操作:

    tabOne = re.findall(r"((?:[A-Z][a-z]*\s?)+)", str(initialFilter))
    
    tabOne = re.findall(r"[A-Z][a-z]*", str(initialFilter))
    results = ' '.join(tabOne)
    

    抱歉,在我发布之前没有测试我的正则表达式。我马上就修好。