Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python代码仅适用于标题标记,不适用于表_Python_Python 2.7 - Fatal编程技术网

Python代码仅适用于标题标记,不适用于表

Python代码仅适用于标题标记,不适用于表,python,python-2.7,Python,Python 2.7,在正则表达式中,当写入(.+?)时,它正在工作,但当此标题标记更改为(.+?)时,它将“[]”(方括号)作为输出。 我的代码是: import urllib import re urls = ["http://physics.iitd.ac.in/content/list-faculty-members", "http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=ME","http://www.iitkgp.ac.i

在正则表达式中,当写入
(.+?)
时,它正在工作,但当此标题标记更改为
(.+?)
时,它将“[]”(方括号)作为输出。 我的代码是:

import urllib
import re

urls = ["http://physics.iitd.ac.in/content/list-faculty-members", "http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=ME","http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=CE"]
i = 0
regex = '<table>(.+?)</table>'
pattern = re.compile(regex)

while i< len(urls):
    htmlfile = urllib.urlopen(urls[i])
    htmltext = htmlfile.read()
    tables  = re.findall(pattern,htmltext)

    print tables
    i+=1
导入urllib
进口稀土
URL=[”http://physics.iitd.ac.in/content/list-faculty-members", "http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=ME","http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=CE"]
i=0
正则表达式='(.+?)'
pattern=re.compile(regex)
而i
使用:

导入urllib
进口稀土
从BeautifulSoup导入BeautifulSoup作为bs
URL=[”http://physics.iitd.ac.in/content/list-faculty-members", 
"http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=ME", 
"http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=CE"]
i=0
而i
谢谢,它工作得很好。:)还有一个问题:如果我希望从表中下载的数据只显示为表结构,会发生吗?你能详细说明你需要什么吗?是的,我想要的是上面的链接由表形式的教授数据组成,在运行此代码时,我得到了他们的所有详细信息,但不知道这一点的人无法理解。所以我想知道它是否可以在cmd上以相同的表格格式下载?尽管我已经用我尝试过的代码和您帮助过的代码发布了另一个问题。我可以把问题的链接发给你吗@伯尼,你可以。我会回答这个问题
import urllib
import re

from BeautifulSoup import BeautifulSoup as bs

urls = ["http://physics.iitd.ac.in/content/list-faculty-members", 
        "http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=ME", 
        "http://www.iitkgp.ac.in/commdir3/list.php?division=3&deptcode=CE"]
i = 0

while i < len(urls):
    htmlfile = urllib.urlopen(urls[i])
    htmltext = htmlfile.read()
    soup = bs(htmltext)
    tables = soup.find_all('table')

    print tables
    i+=1