Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/279.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript Python HTML getElementsByClassName对文件内容进行类似操作_Javascript_Python_Dom_Tags_Html Parsing - Fatal编程技术网

Javascript Python HTML getElementsByClassName对文件内容进行类似操作

Javascript Python HTML getElementsByClassName对文件内容进行类似操作,javascript,python,dom,tags,html-parsing,Javascript,Python,Dom,Tags,Html Parsing,我已使用Sikuli将页面的源代码保存到文件中。我需要一个矩阵样式放置元素批“综述”。但我不想计算它们之间的尺寸。我想在位置栏中键入URL。因此,我在MZDN JavaScript的帮助下从头开始编写了这样一个“简单”操作的实现。我不想使用lxml。我想要真正的本地库——我的意思是我需要“可移植”的脚本。 所以我在Google上搜索了一会儿,决定在Stack OverFlow上问一个问题。 我不想用 split('<a href=') 你想把这段代码翻译成Python吗?是的!我希望这是

我已使用Sikuli将页面的源代码保存到文件中。我需要一个矩阵样式放置元素批“综述”。但我不想计算它们之间的尺寸。我想在位置栏中键入URL。因此,我在MZDN JavaScript的帮助下从头开始编写了这样一个“简单”操作的实现。我不想使用lxml。我想要真正的本地库——我的意思是我需要“可移植”的脚本。 所以我在Google上搜索了一会儿,决定在Stack OverFlow上问一个问题。 我不想用

split('<a href=')

你想把这段代码翻译成Python吗?是的!我希望这是在*.py文件中完成的,它是*.sikuli的一部分。我正在成长。所以我知道Python并不是万能的。我用JavaScript很容易做到这一点,但让它成为pythonic将占用我一天的时间。所以我更愿意听聪明人的话。我可以帮助你,但只能使用外部库,我不知道有谁会用本地库解析html,不幸的是它们不是很好。谢谢你的帮助。美丽的乌苏可能会有所帮助。我可以把它的文件夹放在脚本附近。但是,当类名包含空格时,它不会findAll。我不想用我在那里学到的函数来制作这个模块。jshell(来自Mozilla)不知道getElementsByClassName,所以请避免。
var array = document.getElementsByClassName('another')

var j = array.length
for (i=0;i<j;i++) {
    element = array[i];
    url = element.getElementsByTagName('a')[0].href;
    console.log(url);
    }

var array = document.getElementsByClassName('else')
var j = array.length
for (i=0;i<j;i++) {
    element = array[i];
    url = element.getElementsByTagName('a')[0].href;
    console.log(url);
    }
def read_file(filename):
    fd = open(filename, 'r')
    data = fd.read()
    fd.close()
    return data

def href(line):
        url = line.split('a href=')[1].split('>')[0].strip().replace('"', '').replace("'", '')
        return url

html = read_file('source.htm').split('\n')
for line in html:
    if 'one' in line:
        print href(line)
    elif 'another' in line:
        print href(line)
    elif 'else' in line:
        print href(line)