Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/348.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 关于web抓取-使用urllib(也可能是beautifulsoup)_Python_Python 2.7_Web Scraping - Fatal编程技术网

Python 关于web抓取-使用urllib(也可能是beautifulsoup)

Python 关于web抓取-使用urllib(也可能是beautifulsoup),python,python-2.7,web-scraping,Python,Python 2.7,Web Scraping,我正在从以下网站抓取信息: 我要分析的标记有:开始-,结束- 我的代码: from urllib import urlopen from bs4 import BeautifulSoup import re html = urlopen('http://mansci.journal.informs.org/gca?gca=mansci%3B6%2F2%2F141&gca=mansci%3B6%2F2%2F149&gca=mansci%3B6%2F2%2F165&gca=

我正在从以下网站抓取信息:

我要分析的标记有:开始-

,结束-

我的代码:

from urllib import urlopen
from bs4 import BeautifulSoup
import re

html = urlopen('http://mansci.journal.informs.org/gca?gca=mansci%3B6%2F2%2F141&gca=mansci%3B6%2F2%2F149&gca=mansci%3B6%2F2%2F165&gca=mansci%3B6%2F2%2F172&gca=mansci%3B6%2F2%2F187&gca=mansci%3B6%2F2%2F191&gca=mansci%3B6%2F2%2F197&gca=mansci%3B6%2F2%2F205&gca=mansci%3B6%2F2%2F215&submit=Get+All+Checked+Abstracts').read()

a = re.compile('<p id="p-1">(.*)</p>')
b = re.findall(a,html)
从urllib导入urlopen
从bs4导入BeautifulSoup
进口稀土
html=urlopen('http://mansci.journal.informs.org/gca?gca=mansci%3B6%2F2%2F141&gca=mansci%3B6%2F2%2F149&gca=mansci%3B6%2F2%2F165&gca=mansci%3B6%2F2%2F172&gca=mansci%3B6%2F2%2F187&gca=mansci%3B6%2F2%2F191&gca=mansci%3B6%2F2%2F197&gca=mansci%3B6%2F2%2F205&gca=mansci%3B6%2F2%2F215&submit=Get+全部+选中+摘要“).read()
a=重新编译('

(.*)

) b=re.findall(a,html)

我遇到的问题是,我的代码看起来是逐行的,我不知道如何解析整个段落。

使用beautifulsoup,然后执行以下操作:

from urllib2 import urlopen
from bs4 import BeautifulSoup

soup = BeautifulSoup(urlopen(your_url).read())
print soup.find('p', {'id': 'p-1'}).text

测量的可能性不一定会导致 提供相关信息以供决策 生意。这可以通过参考会计方法,特别是利润计算来证明。 会计程序 已经正式化,以至于他们歪曲了财务结果和财务状况;可能性 资源 将被有效利用,利益相关方之间的权益将因 缺乏照顾 在定义重要概念和同时接受直接具有 相反的理由 以及后果。随着信息处理速度的提高和计算的精细化 开发出相应的 有必要努力用与操作相关的术语重新定义,或强化这类概念的定义 关键概念如利润, 资金、成本。会计和辅助计算的发展历史说明了 许可的后果 一个将制度化的测量和沟通系统。提高关联性的几点建议 会计学 并提供了类似的信息


我已经修改了格式,并删除了有关间距的注释。谢谢!第一次在这个网站上。只是学习如何编码!非常有用。我看看我能从这里做些什么