String AttributeError:'str'对象没有属性'text'python 2.7
Ik有很多这样的问题,但答案都是特定的,只能解决特定于人员的脚本。 我目前正试图打印supremenewyork.com上的一堆信息 来自英国网站。这个脚本可以成功地打印出我想要的supreme us的所有信息,但是当我添加代理脚本时,我发现了很多错误。 我知道prxy脚本是有效的,因为我在一个小scipt上测试了它,它能够获取supreme uk上的信息,而supreme us上不存在这些信息 这是我的剧本String AttributeError:'str'对象没有属性'text'python 2.7,string,python-2.7,proxy,beautifulsoup,python-requests,String,Python 2.7,Proxy,Beautifulsoup,Python Requests,Ik有很多这样的问题,但答案都是特定的,只能解决特定于人员的脚本。 我目前正试图打印supremenewyork.com上的一堆信息 来自英国网站。这个脚本可以成功地打印出我想要的supreme us的所有信息,但是当我添加代理脚本时,我发现了很多错误。 我知道prxy脚本是有效的,因为我在一个小scipt上测试了它,它能够获取supreme uk上的信息,而supreme us上不存在这些信息 这是我的剧本 import requests from bs4 import BeautifulSo
import requests
from bs4 import BeautifulSoup
UK_Proxy1 = raw_input('UK http Proxy1: ')
UK_Proxy2 = raw_input('UK http Proxy2: ')
proxies = {
'http': 'http://' + UK_Proxy1 + '',
'https': 'http://' + UK_Proxy2 + '',
}
categorys = ['jackets','shirts','tops_sweaters','sweatshirts','pants','shorts','t- shirts','hats','hats','bags','accessories','shoes','skate']
catNumb = 0
altArray = []
nameArray = []
styleArray = []
for cat in categorys:
catStr = str(categorys[catNumb])
cUrl = 'http://www.supremenewyork.com/shop/all/' + catStr
proxy_script = requests.get((cUrl.text), proxies=proxies)
bSoup = BeautifulSoup(proxy_script, 'lxml')
print('\n*******************"'+ catStr.upper() + '"*******************\n')
catNumb += 1
for item in bSoup.find_all('div', class_='inner-article'):
url = item.a['href']
alt = item.find('img')['alt']
req = requests.get('http://www.supremenewyork.com' + url)
item_soup = BeautifulSoup(req.text, 'lxml')
name = item_soup.find('h1', itemprop='name').text
style = item_soup.find('p', itemprop='model').text
print alt +(' --- ')+ name +(' --- ')+ style
altArray.append(alt)
nameArray.append(name)
styleArray.append(style)
print altArray
print nameArray
print styleArray
我在执行脚本时遇到此错误
AttributeError:“str”对象没有属性“text”,错误指向
proxy\u script=requests.getcUrl.text,proxies=proxies
我最近在脚本中添加了这个,sorta修复了它。。。它能够打印类别的信息,但它们之间没有任何信息。我需要的只是打印的*********************夹克******************************,*****衬衫*********等等。。。。这是我改变的
import requests
from bs4 import BeautifulSoup
# make sure proxy is http and port 8080
UK_Proxy1 = raw_input('UK http Proxy1: ')
UK_Proxy2 = raw_input('UK http Proxy2: ')
proxies = {
'http': 'http://' + UK_Proxy1 + '',
'https': 'http://' + UK_Proxy2 + '',
}
categorys = ['jackets','shirts','tops_sweaters','sweatshirts','pants','shorts','t-shirts','hats','bags','accessories','shoes','skate']
catNumb = 0
altArray = []
nameArray = []
styleArray = []
for cat in categorys:
catStr = str(categorys[catNumb])
cUrl = 'http://www.supremenewyork.com/shop/all/' + catStr
proxy_script = requests.get(cUrl, proxies=proxies).text
bSoup = BeautifulSoup(proxy_script, 'lxml')
print('\n*******************"'+ catStr.upper() + '"*******************\n')
catNumb += 1
for item in bSoup.find_all('div', class_='inner-article'):
url = item.a['href']
alt = item.find('img')['alt']
req = requests.get('http://www.supremenewyork.com' + url)
item_soup = BeautifulSoup(req.text, 'lxml')
name = item_soup.find('h1', itemprop='name').text
style = item_soup.find('p', itemprop='model').text
print alt +(' --- ')+ name +(' --- ')+ style
altArray.append(alt)
nameArray.append(name)
styleArray.append(style)
打印altArray
打印名称数组
打印样式数组
我把.text放在了最后,它有点起作用了。。。。我如何修复它,使它打印出我想要的信息???我想你错过了smt。您的cUrl是字符串类型,而不是请求类型。我想你想要:
proxy\u script=requests.getcUrl,proxies=proxies.text您将cUrl定义为字符串:cUrl=http://www.supremenewyork.com/shop/all/“+catStr。该字符串没有文本属性。请尝试运行requests.getcUrl。@patrick这不起作用。当我在没有文本的情况下运行脚本时,会出现此错误:bs4/_init__.py,第192行,在init elif lenmarkup中。解决第一个问题后,请不要向原始问题添加新问题。看看。@KeyurPotdar bruh。。。。。第一个还没解决,我明白了。获得帮助也是如此。只要遵守规则,你就会得到你想要的一切帮助。在这里发布新问题是最好的方法。另外,如果你把你的问题回滚到第一版,其他人可能会在以后再做。我添加了你的脚本,它打印了***************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************???通常,它会打印包含项目代码、名称和颜色的类别,但它只是一个空格^^^^^^^^^@dx247^