Python 如何从URL链接中提取所有域?
我正在尝试使用urlparse从链接中提取所有域。但由于某些原因,有时我会收到域列表,有时会收到以下错误消息: 非类型对象不可下标 有什么问题吗?我怎样才能修好它?谢谢大家! UPD:好的,我已经解决了。这是解决办法Python 如何从URL链接中提取所有域?,python,python-3.x,beautifulsoup,Python,Python 3.x,Beautifulsoup,我正在尝试使用urlparse从链接中提取所有域。但由于某些原因,有时我会收到域列表,有时会收到以下错误消息: 非类型对象不可下标 有什么问题吗?我怎样才能修好它?谢谢大家! UPD:好的,我已经解决了。这是解决办法 if arg.name: try: page = requests.get(arg.name) soup = BeautifulSoup(page.text,features='html.parser') links = soup.findAll("a")
if arg.name:
try:
page = requests.get(arg.name)
soup = BeautifulSoup(page.text,features='html.parser')
links = soup.findAll("a")
for i in links:
domain = urlparse(i.get("href")).hostname
**if type(domain) == str:**
if clink.get(domain):
clink[domain]+=1
else:
clink[domain]=1
for key in sorted(clink, key=lambda x: x[-1]):
print(key, clink[key])
except Exception as e:
print("Incorrect address! Try again!" + '\n\n' + "More about this error: " + '\n\n' + str(e))
向我们展示链接列表和完整的错误回溯!谢谢大家!我已经找到了解决办法!