如何在Python selenium中从网页的HTML表中获取数据

如何在Python selenium中从网页的HTML表中获取数据,python,selenium,bioinformatics,Python,Selenium,Bioinformatics,这就是我想要的 链接“http://tinyurl.com/2bp99mm" 使用“ewqlvlnvwgkvoidpghgqeflirlfkghpetlekfdkflksedemkasedlkkhgatvltalggilkkghheakpaqshatkhipvkylefiseciiqlvlqshpgdfgadaqgangamnkalelfrkdmasnykelgfqg”爆破蛋白质序列 生成的网页具有表上的链接列表。在Accesion列中,有一些Web链接是我的兴趣点 我只想要第一个链接的文本,它

这就是我想要的

链接“http://tinyurl.com/2bp99mm"

使用
“ewqlvlnvwgkvoidpghgqeflirlfkghpetlekfdkflksedemkasedlkkhgatvltalggilkkghheakpaqshatkhipvkylefiseciiqlvlqshpgdfgadaqgangamnkalelfrkdmasnykelgfqg”
爆破蛋白质序列

生成的网页具有表上的链接列表。在Accesion列中,有一些Web链接是我的兴趣点

我只想要第一个链接的文本,它以数字开头,第二个字符是字母表。在当前场景中,您将看到“3RGK_A”,这是我想要的文本

我知道我可以使用
links.add(driver.FindElements(By.TagName(“a”)))但是如何满足链接的标准,以数字开头,第二个字符是字母表

我迷路了,不熟悉selenium和python,但我正在努力快速学习。。任何帮助都会得到报答

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support.ui import WebDriverWait 
import time
import numpy,random
import sys,re

driver = webdriver.Firefox()

driver.get("http://tinyurl.com/2bp99mm")
inputElement = driver.find_element_by_name( "QUERY" )
inputElement.send_keys("EWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG")##str(seq2))

inputElement.submit()
# the page is ajaxy so the title is originally this:
print driver.title

driver.implicitly_wait(30)

click_event = driver.find_element_by_link_text("3RGK_A")
click_event.click()

我希望程序找到“3RGK_A”是第一个链接,并将值存储在对象中

您的问题是我如何与页面上的元素交互?或者,我该如何用python编写算法来创建所需的输入?是的,我该如何用python编写算法?我可以使用selenium中的元素按名称进行交互,但我不知道如何使用它。所以我理解你的问题是“如何构建一个字符串(由随机字符组成)?其中第一个字符是数字,第二个字符是任意字符a-Z,应该是X个字符长?”是的,如果您使用链接并输入我在描述中提到的顺序,它将带您进入包含这些链接的页面。现在,自动程序需要找到这些链接,我已经编写了代码,以达到这一点,并点击该链接,但其硬编码,我希望它能自动找到。。我将更新用于测试web应用程序的代码Selenium。它驱动一个真正的网络浏览器。它可能不是您想要做的事情的正确工具。缺点是,任何符合(:link,“3RGK_A”)模式的链接都会成功
begin
   $driver.find_element(:link, "3RGK_A")
   puts "I found the link"
rescue
   puts "I couldn't find the link"
end