Python Web垃圾列表项

Python Web垃圾列表项,python,web-scraping,Python,Web Scraping,我们有一个包含IP地址列表的内部网页。IP地址随附为列表项。我对Python还是有点陌生,希望能有一点方向。我希望最终得到一个文本文件,用逗号分隔这些IP <li>192.168.1.1</li> 192.168.1.1 我正在使用一个公开的网站来回答我的问题,但HTML源代码与此类似 import requests from bs4 import BeautifulSoup URL = 'https://www.w3schools.com/html/tryit.a

我们有一个包含IP地址列表的内部网页。IP地址随附为列表项。我对Python还是有点陌生,希望能有一点方向。我希望最终得到一个文本文件,用逗号分隔这些IP

<li>192.168.1.1</li>
  • 192.168.1.1
  • 我正在使用一个公开的网站来回答我的问题,但HTML源代码与此类似

    import requests
    from bs4 import BeautifulSoup
    
    URL = 'https://www.w3schools.com/html/tryit.asp?filename=tryhtml_lists_intro'
    page = requests.get(URL)
    
    soup = BeautifulSoup(page.content, 'html.parser')
    list_items = soup.find_all('li')
    print(list_items)
    
    [<li>Coffee</li>, <li>Tea</li>, <li>Milk</li>, <li>Coffee</li>, <li>Tea</li>, <li>Milk</li>]
    
    导入请求
    从bs4导入BeautifulSoup
    URL='1〕https://www.w3schools.com/html/tryit.asp?filename=tryhtml_lists_intro'
    page=请求.get(URL)
    soup=BeautifulSoup(page.content,'html.parser')
    列出项目=汤。查找所有('li'))
    打印(列出项目)
    [
  • 咖啡
  • 牛奶
  • 咖啡
  • 牛奶
  • ]
    如何进一步将列表项的输出解析为列表/文本文件,如以下所示:

    咖啡,茶,牛奶,咖啡,茶,牛奶


    谢谢大家!

    您只需将整个标记添加到列表中,而不是它们的文本内容

    list_items = ", ".join([li.text for li in soup.find_all("li")])
    print(list_items)
    

    print([e.text代表列表项中的e])
    或者如果您只需要字符串:
    print(“,”。加入([e.text代表列表项中的e])
    感谢大家的建议!这对像我这样的新python人帮助很大!