Python 美化组:使用html元素中的值

Python 美化组:使用html元素中的值,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我有一个关于如何使用从BeautifulSoup4上的网页提取的数据的问题。这是我的密码: url = "https://www.amazon.com/s/ref=sr_nr_n_0?me=A2L77EE7U53NWQ&fst=as%3Aoff&rh=n%3A1267877011%2Cn%3A1267879011%2Cn%3A1294322011%2Cn%3A1297815011&bbn=1294322011&ie=UTF8&qid=1501968446"

我有一个关于如何使用从BeautifulSoup4上的网页提取的数据的问题。这是我的密码:

url = "https://www.amazon.com/s/ref=sr_nr_n_0?me=A2L77EE7U53NWQ&fst=as%3Aoff&rh=n%3A1267877011%2Cn%3A1267879011%2Cn%3A1294322011%2Cn%3A1297815011&bbn=1294322011&ie=UTF8&qid=1501968446"
page = requests.get(url)
resultsCol = SoupStrainer(id="resultsCol")
time.sleep(1)
soup = BeautifulSoup(page.content, 'html.parser', parse_only=resultsCol)

sResultItem = soup.find_all("li", {"class": "s-result-item"})
for dataAsins in sResultItem:
    dataAsin = dataAsins['data-asin']
    print(dataAsin)

我想做的是将数据作为数字与其他数据分开使用。但是,每当我尝试打印
dataAsin[0:10]
时,它都会给我所有的数据asin,而不是一个。如果我能在这个问题上得到一些帮助,我将非常感激。提前感谢您的反馈。

使用列表理解来收集列表中的所有“数据asin”属性。然后你可以选择任何你想要的项目

dataAsins = [ li['data-asin'] for li in sResultItem ]

另外,“dataAsin”变量是什么类型的数据类型?您在
dataAsins
中得到了什么?此外,您还可以使用
type(dataAsin)
获取变量的类型。在编写代码时,我使用了大量的
print('var',type(var),var)
语句。
dataAsin
是一个字符串,因此
dataAsin[0:10]
给出前10个字符。这是“数据ASIN”的输出:B002TZ4CRG B00006I5O6 B00028ONIA B000207XK B0015YRMXI B0033UPFT0 B00375MPA8 B0028QREZ8 B0007ZL6DS B007KZQM9Q B0026VWNGU B001BBOZ08 B000067Rhatasin[0:10]打印所有数字,数据ASIN[0]打印“B”11次