Python 只返回一个字符串,而不是两个几乎相同的字符串

Python 只返回一个字符串,而不是两个几乎相同的字符串,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我试图从网页中获取多个链接,但当我打印结果时,我得到: /t54-EXAMPLE-fansub /t54-EXAMPLE-fansub#55 如何在输出中只获取其中一个而不是两个?您可以这样做: >>'/t54示例fansub#55'.拆分('#')#只是为了显示列表输出 ['/t54示例fansub','55'] >>>“/t54示例扇子#55.”拆分(“#”)[0] “/t54示例风扇SUB” >>>“/t54示例扇子”.split(“#”)[0] “/t54示例风扇SUB” 我假设您将有

我试图从网页中获取多个链接,但当我打印结果时,我得到:

/t54-EXAMPLE-fansub
/t54-EXAMPLE-fansub#55
如何在输出中只获取其中一个而不是两个?

您可以这样做:

>>'/t54示例fansub#55'.拆分('#')#只是为了显示列表输出
['/t54示例fansub','55']
>>>“/t54示例扇子#55.”拆分(“#”)[0]
“/t54示例风扇SUB”
>>>“/t54示例扇子”.split(“#”)[0]
“/t54示例风扇SUB”

我假设您将有一个名为“链接”的列表,其中包含您刮取的所有链接

links = ["/t54-EXAMPLE-fansub#55","/t54-EXAMPLE-fansub","/t55-EXAMPLE-fansub"]

links = set(map(lambda x:x[:x.index('#')] if '#' in x else x, links))
for link in links:
    print(link)

这会将链接类型更改为集合,请小心。这段代码只是您所能做的一个示例实现:浏览链接,去掉第一个“#”后的零件,创建一个集合,以便跟踪您已经遇到的问题。

到目前为止您尝试了什么?预期的输出是什么?只有第一个?请提供一份