Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python-报纸库-为什么它缺少文章中相当大的部分?_Python_Python 2.7_Parsing_Nlp_Python Newspaper - Fatal编程技术网

Python-报纸库-为什么它缺少文章中相当大的部分?

Python-报纸库-为什么它缺少文章中相当大的部分?,python,python-2.7,parsing,nlp,python-newspaper,Python,Python 2.7,Parsing,Nlp,Python Newspaper,我在用报纸图书馆,2.7节 当我下载、解析和打印文本时,它为我提供了比现实中少得多的文章内容。为什么会这样?有办法解决这个问题吗 这是我的密码: from newspaper import Article url = "http://www.nytimes.com/2010/10/07/us/politics/07manchin.html" article_object = Article(url, language = 'en') article_object.download() art

我在用报纸图书馆,2.7节

当我下载、解析和打印文本时,它为我提供了比现实中少得多的文章内容。为什么会这样?有办法解决这个问题吗

这是我的密码:

from newspaper import Article

url = "http://www.nytimes.com/2010/10/07/us/politics/07manchin.html"

article_object = Article(url, language = 'en')
article_object.download()
article_object.parse()
article_object.text
如果查看它打印出来的内容,,就会发现article.text跳过了实际文章的前7-8段。有没有办法确保捕获“完整”文章

以下是article_object.text的输出:

全国共和党闻到了血腥味,正在花钱 数以百万计的人在这里做电视广告,作为其重新夺回冠军的一部分 参议院一则新的广告显示,戴棒球帽的男子预测说。 Manchin将转变为\u201cWashington Joe\u201d, \我们必须阻止奥巴马。\u201d\n\n照片\n\nMr。曼基 我以为他在这种状态下用一个 民主党占多数,但价值观保守。他赢得了他的第二个任期 2008年州长以70%的得票率当选,赢得了赞誉 财政责任;就连雷泽先生都称他为一位好州长。 他得到了全国步枪协会商会的支持 协会以及煤炭行业和煤矿工人。\n\n。 曼钦强调了他在保守主义方面的资历和政治上的记录 他指责他的对手发动了一场反对独立的运动 \U201C清理和抹黑。\u201d但反奥巴马的信息似乎是 与一些居民产生了共鸣\u2014可能是与投票人相同的选民 在过去的三年里,该州一直在向参议员约翰·麦凯恩和布什总统致敬 总统选举。\n\n\u201cManchin是一位伟大的州长, 41岁的杰夫·惠廷顿说:“但我会投雷泽的票。”, 查尔斯顿的轮胎经销商\u201cI认为曼钦会 他重复道:“参议院和国会将成为奥巴马的橡皮图章。” Raese先生\u2019的消息几乎是逐字逐句。\n\n处于 煤炭被视为繁荣的源泉,雷泽抓住了什么 他呼吁曼钦先生就一项新的提案发表模棱两可的声明 减少温室气体排放的限额交易制度。曼钦先生现在 他在这个问题上说得很清楚:他坚决反对总量管制与排放交易以及 碳税,他在采访中强调。 曼钦有机会强调他对煤炭的支持,并表示支持 与总统保持距离。带着煤头 制作人协会在州议会大厦他身边,他说 宣布该州正在起诉两个联邦机构,寻求 扭转中国对山顶煤矿开采的更严格控制 2009年由奥巴马政府发布。\n\n请继续阅读 主要故事是\n\n驳回针对环境保护的诉讼 曼钦说,保护局和陆军工程兵团 更严格的程序是非法的,并且损害了公众利益 他指责该州政府将新的采矿项目拖慢至涓涓细流 奥巴马政府试图摧毁我们的煤炭工业和 生活方式。\u201d\n\nE.P.A.回应称其行动是 合法且科学合理。\n\n。独立专家曼钦 就连西弗吉尼亚煤炭协会也对一项提议表示反对 Raese广告指控Manchin先生通过了一项州法律 \U201限制了我们电力中25%的煤炭使用量 植物。\u201d\n\n事实上,法律要求在新能源方面取得进展 包括清洁煤在内的技术,并得到了 行业。\n\n。雷泽还抨击了州长过去的行为 欢迎奥巴马健康计划的声明;曼钦先生说有些 该计划的核心要素,如保护儿童, 是好的,但是其他的应该被废除。雷泽先生打电话给 健康计划\u201c纯粹的、纯粹的社会主义\u201d应该是 完全被抛弃,这一信息吸引了许多小企业 所有者。\n\n照片\n\nMr。雷泽是一个强壮自信的男人 以前和现在竞选参议院和州长都没有成功 感觉到水流在向他流动\U201周你把一个 商业计划当你面临奥巴马医改时,当你 你面临着总量管制和交易吗?\u201d他在一次采访中问道 共和党在摩根敦的办公室,他的总部。\n\n。雷泽跑步 石灰石矿山和一家钢铁制造公司,是一家 广播网和报纸。他在世界各地至少有三所房子 他和妻子住在佛罗里达州棕榈滩的家中 他一直在西弗吉尼亚州居住。\n\n而雷泽先生\u2019s 反华盛顿的信息具有广泛的吸引力,他毫不含糊地支持 北美自由贸易协定和自由贸易,以及他对工会的反对,在这方面可能对他没有帮助 有蓝领传统的州。曼钦先生的竞选活动已经结束 播放拉泽吹嘘自己继承的财富和财富的广告 强调他反对最低工资和其他工人福利 保护措施。\n\n在全州的采访中,一些居民说 虽然雷泽先生看起来很傲慢,但他们钦佩他的工作记录 创造就业机会,并准备给华盛顿带来一张新面孔 而不是选一个他们视为职业政治家的人。\n\n提名 继续阅读主要新闻\n\n到目前为止发布的唯一民意调查 在没有个人访谈的情况下自动完成\u2014,并且 不被广泛接受为可靠的。但两大阵营都进行了私人投票 表示一场意外的势均力敌的比赛。\n\n法兰西斯,53岁,法国律师 查尔斯顿说,他喜欢曼钦先生担任州长 如果他在参议院竞选中失利,他将保住自己的工作,但事实上他是 倾向于投雷泽的票,因为他担心选举会失败 联邦赤字飞涨,认为政府的作用太大 在经济中。\n\n其他人,包括Cheryl Bonner