Javascript Python HTML getElementsByClassName对文件内容进行类似操作_Javascript_Python_Dom_Tags_Html Parsing

Javascript Python HTML getElementsByClassName对文件内容进行类似操作

javascript python dom tags

Javascript Python HTML getElementsByClassName对文件内容进行类似操作,javascript,python,dom,tags,html-parsing,Javascript,Python,Dom,Tags,Html Parsing,我已使用Sikuli将页面的源代码保存到文件中。我需要一个矩阵样式放置元素批“综述”。但我不想计算它们之间的尺寸。我想在位置栏中键入URL。因此，我在MZDN JavaScript的帮助下从头开始编写了这样一个“简单”操作的实现。我不想使用lxml。我想要真正的本地库——我的意思是我需要“可移植”的脚本。所以我在Google上搜索了一会儿，决定在Stack OverFlow上问一个问题。我不想用 split('<a href=') 你想把这段代码翻译成Python吗？是的！我希望这是

我已使用Sikuli将页面的源代码保存到文件中。我需要一个矩阵样式放置元素批“综述”。但我不想计算它们之间的尺寸。我想在位置栏中键入URL。因此，我在MZDN JavaScript的帮助下从头开始编写了这样一个“简单”操作的实现。我不想使用lxml。我想要真正的本地库——我的意思是我需要“可移植”的脚本。所以我在Google上搜索了一会儿，决定在Stack OverFlow上问一个问题。我不想用

split('<a href=')

你想把这段代码翻译成Python吗？是的！我希望这是在*.py文件中完成的，它是*.sikuli的一部分。我正在成长。所以我知道Python并不是万能的。我用JavaScript很容易做到这一点，但让它成为pythonic将占用我一天的时间。所以我更愿意听聪明人的话。我可以帮助你，但只能使用外部库，我不知道有谁会用本地库解析html，不幸的是它们不是很好。谢谢你的帮助。美丽的乌苏可能会有所帮助。我可以把它的文件夹放在脚本附近。但是，当类名包含空格时，它不会findAll。我不想用我在那里学到的函数来制作这个模块。jshell（来自Mozilla）不知道getElementsByClassName，所以请避免。

var array = document.getElementsByClassName('another')

var j = array.length
for (i=0;i<j;i++) {
    element = array[i];
    url = element.getElementsByTagName('a')[0].href;
    console.log(url);
    }

var array = document.getElementsByClassName('else')
var j = array.length
for (i=0;i<j;i++) {
    element = array[i];
    url = element.getElementsByTagName('a')[0].href;
    console.log(url);
    }

def read_file(filename):
    fd = open(filename, 'r')
    data = fd.read()
    fd.close()
    return data

def href(line):
        url = line.split('a href=')[1].split('>')[0].strip().replace('"', '').replace("'", '')
        return url

html = read_file('source.htm').split('\n')
for line in html:
    if 'one' in line:
        print href(line)
    elif 'another' in line:
        print href(line)
    elif 'else' in line:
        print href(line)