连接Python中re.findall找到的字符串
用搜索栏从网站上抓取数据 我正在使用python进行搜索,然后对搜索结果进行过滤,以查找连接Python中re.findall找到的字符串,python,Python,用搜索栏从网站上抓取数据 我正在使用python进行搜索,然后对搜索结果进行过滤,以查找“像这样的词”: 问题是,我试图获取的数据有时是多个单词,例如“Item Number One”,但re.findall显示为“Item”“Number”“One” 我希望将数据的原始形式保留为一个短语,但我不确定如何告诉python将它们组合在一起 [A-Z][A-Z]单词的短语在页面上总是相互隔离的,因此我想知道是否可以检查这些单词旁边的字符是否也是[A-Z][A-Z],如果是,将它们分组在一起 有什么建
“像这样的词”
:
问题是,我试图获取的数据有时是多个单词,例如“Item Number One”,但re.findall显示为“Item”“Number”“One”
我希望将数据的原始形式保留为一个短语,但我不确定如何告诉python将它们组合在一起
[A-Z][A-Z]单词的短语在页面上总是相互隔离的,因此我想知道是否可以检查这些单词旁边的字符是否也是[A-Z][A-Z]
,如果是,将它们分组在一起
有什么建议吗?两种不同的方法:
tabOne = re.findall(r"((?:[A-Z][a-z]*\s?)+)", str(initialFilter))
tabOne = re.findall(r"[A-Z][a-z]*", str(initialFilter))
results = ' '.join(tabOne)
对于(2),您可以执行以下操作:
tabOne = re.findall(r"((?:[A-Z][a-z]*\s?)+)", str(initialFilter))
tabOne = re.findall(r"[A-Z][a-z]*", str(initialFilter))
results = ' '.join(tabOne)
抱歉,在我发布之前没有测试我的正则表达式。我马上就修好。