Python Web垃圾列表项
我们有一个包含IP地址列表的内部网页。IP地址随附为列表项。我对Python还是有点陌生,希望能有一点方向。我希望最终得到一个文本文件,用逗号分隔这些IPPython Web垃圾列表项,python,web-scraping,Python,Web Scraping,我们有一个包含IP地址列表的内部网页。IP地址随附为列表项。我对Python还是有点陌生,希望能有一点方向。我希望最终得到一个文本文件,用逗号分隔这些IP <li>192.168.1.1</li> 192.168.1.1 我正在使用一个公开的网站来回答我的问题,但HTML源代码与此类似 import requests from bs4 import BeautifulSoup URL = 'https://www.w3schools.com/html/tryit.a
<li>192.168.1.1</li>
192.168.1.1
我正在使用一个公开的网站来回答我的问题,但HTML源代码与此类似
import requests
from bs4 import BeautifulSoup
URL = 'https://www.w3schools.com/html/tryit.asp?filename=tryhtml_lists_intro'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
list_items = soup.find_all('li')
print(list_items)
[<li>Coffee</li>, <li>Tea</li>, <li>Milk</li>, <li>Coffee</li>, <li>Tea</li>, <li>Milk</li>]
导入请求
从bs4导入BeautifulSoup
URL='1〕https://www.w3schools.com/html/tryit.asp?filename=tryhtml_lists_intro'
page=请求.get(URL)
soup=BeautifulSoup(page.content,'html.parser')
列出项目=汤。查找所有('li'))
打印(列出项目)
[咖啡 ,茶 ,牛奶 ,咖啡 ,茶 ,牛奶 ]
如何进一步将列表项的输出解析为列表/文本文件,如以下所示:
咖啡,茶,牛奶,咖啡,茶,牛奶
谢谢大家! 您只需将整个标记添加到列表中,而不是它们的文本内容
list_items = ", ".join([li.text for li in soup.find_all("li")])
print(list_items)
print([e.text代表列表项中的e])
或者如果您只需要字符串:print(“,”。加入([e.text代表列表项中的e])
感谢大家的建议!这对像我这样的新python人帮助很大!