如何在python中获取文本的值
我有以下HTML代码:如何在python中获取文本的值,python,string,get,Python,String,Get,我有以下HTML代码: <form action="/pe/cart/add" class="add_to_cart_form" id="addToCartFormbt_NE_10677654" method="post"> <input name="productCodePost" type="hidden" value="bt_NE_10
<form action="/pe/cart/add" class="add_to_cart_form" id="addToCartFormbt_NE_10677654" method="post">
<input name="productCodePost" type="hidden" value="bt_NE_10677654"/>
<input name="productNamePost" type="hidden" value="Nike Air VaporMax 2020 FK"/>
<input name="productPostPrice" type="hidden" value="899.9"/>
</form>
我想得到这些值'bt_NE_10677654'和'899.9'。我如何才能做到这一点?您可以使用“re”模块,或者如果您从web上删除此模块,您可能会看到此回购:
您可以尝试使用BeautifulSoup:
from bs4 import BeautifulSoup as bs
page = """<form action="/pe/cart/add" class="add_to_cart_form" id="addToCartFormbt_NE_10677654" method="post">
<input name="productCodePost" type="hidden" value="bt_NE_10677654"/>
<input name="productNamePost" type="hidden" value="Nike Air VaporMax 2020 FK"/>
<input name="productPostPrice" type="hidden" value="899.9"/>
</form>"""
soup = bs(page, features="lxml")
a = soup.find_all(attrs={"name" : "productCodePost"})[0]["value"]
b = soup.find_all(attrs={"name" : "productPostPrice"})[0]["value"]
print(a,b)
>>> bt_NE_10677654 899.9
从bs4导入美化组作为bs
第“”页
"""
汤=bs(第页,features=“lxml”)
a=soup.find_all(attrs={“name”:“productCodePost”})[0][“value”]
b=soup.find_all(attrs={“name”:“productPostPrice”})[0][“value”]
印刷品(a、b)
>>>bt_NE_10677654 899.9
请分享您的尝试。在python中有很多方法可以检索这种格式的数据,您可以尝试使用类似Selenium的webscraper