Python 解析活动不稳定,得到一些随机结果

Python 解析活动不稳定,得到一些随机结果,python,html,parsing,beautifulsoup,urllib2,Python,Html,Parsing,Beautifulsoup,Urllib2,代码如下: # -*- coding: utf-8 -*- import urllib2 from bs4 import BeautifulSoup with open('/users/Rachael/Desktop/CheckTitle.csv', 'r') as readcsv: for row in readcsv.readlines(): try: openitem = urllib2.urlopen(row).read()

代码如下:

# -*- coding: utf-8 -*-
import urllib2
from bs4 import BeautifulSoup

with open('/users/Rachael/Desktop/CheckTitle.csv', 'r') as readcsv:
    for row in readcsv.readlines():
        try:
            openitem = urllib2.urlopen(row).read()
            soup = BeautifulSoup(openitem, 'lxml')
            print soup.head.find('title').get_text()

        except urllib2.URLError:
            print 'passed'
            pass
我得到了以下结果:

(a) :

(b) :

已通过
回溯(最近一次呼叫最后一次):
文件“C:/Users/Rachael/PycharmProjects/untitled1/GetTitle.py”,第10行,在
打印soup.head.find('title').get_text()
AttributeError:“非类型”对象没有属性“查找”
(c) :

已通过
贝贝网京外裁员10%:团队要保持狼性和危机感_新浪财经_新浪网
回溯(最近一次呼叫最后一次):
文件“C:/Users/Rachael/PycharmProjects/untitled1/GetTitle.py”,第10行,在
打印soup.head.find('title').get_text()
AttributeError:“非类型”对象没有属性“查找”
我随机得到这三种结果

如果改为使用soup.title或soup.title.text或soup.title.string,它将返回相同/类似的错误

请帮忙

我发现这很难描述,所以如果这是一个dup在任何方面,请给我类似的帖子链接


谢谢

'NoneType'对象没有属性
如果此对象没有结果,则会发生错误,请尝试仅打印
打印soup.head.find('title')
title,而不打印
。文本
它应该返回类似“[]”或“None”的内容

回答:没有实际的标题标记,或者该文件中的某个站点上有某种类型的机器人保护。

对象没有属性
如果此对象没有结果,则会发生错误,请尝试仅打印
打印soup.head.find('title'))
title而不打印
.text
它应该返回类似“[]”或“无”的内容

回答:没有实际的标题标签,或者在文件中的某个站点上有某种类型的机器人保护。

你确定那些出错的页面有
标签吗?是的,我检查了网页,它们都有标签你确定那些出错的页面有
标签?是的我查了网页他们都有标签
passed
贝贝网京外裁员10%:团队要保持狼性和危机感_新浪财经_新浪网
垂直电商贝贝网被曝裁员 回应称只是10%人员优化_新浪财经_新浪网
passed
Traceback (most recent call last):
  File "C:/Users/Rachael/PycharmProjects/untitled1/GetTitle.py", line 10, in 
<module>
    print soup.head.find('title').get_text()
AttributeError: 'NoneType' object has no attribute 'find'
passed
贝贝网京外裁员10%:团队要保持狼性和危机感_新浪财经_新浪网
Traceback (most recent call last):
  File "C:/Users/Rachael/PycharmProjects/untitled1/GetTitle.py", line 10, in <module>
    print soup.head.find('title').get_text()
AttributeError: 'NoneType' object has no attribute 'find'