Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/396.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何从网站自动检索过程_Java_Web - Fatal编程技术网

Java 如何从网站自动检索过程

Java 如何从网站自动检索过程,java,web,Java,Web,这是一个生物数据库, 通常,如果我输入一个基因名(字符串)(例如TF53)并将其命名,它会在网页上返回结果。此外,如果用户希望将其另存为制表符分隔的/XML文件,则可以选择它。然而,我有一个基因名列表,其中包含了数千个以上的基因名。如何通过Java程序将这一系列过程自动化 我知道这个问题可能涉及面很广,而且可能有各种各样的解决方法。我在Java编程方面只有一点经验,如果有人能提出一种更简单的方法,我将不胜感激。谢谢 其中一种可能性是从列表中顺序读取基因名称,并相互发送请求: http://www

这是一个生物数据库, 通常,如果我输入一个基因名(字符串)(例如TF53)并将其命名,它会在网页上返回结果。此外,如果用户希望将其另存为制表符分隔的/XML文件,则可以选择它。然而,我有一个基因名列表,其中包含了数千个以上的基因名。如何通过Java程序将这一系列过程自动化


我知道这个问题可能涉及面很广,而且可能有各种各样的解决方法。我在Java编程方面只有一点经验,如果有人能提出一种更简单的方法,我将不胜感激。谢谢

其中一种可能性是从列表中顺序读取基因名称,并相互发送请求:

http://www.genecards.org/index.php?path=/GeneDecks/ParalogHunter//100/{%22Sequence_paralog%22:%221%22,%22Domains%22:%221%22,%22Super_Pathways%22:%221%22,%22Expression_Patterns%22:%221%22,%22Phypeotys%22:%221%22,%22Disorders%22:%221%22,%22Gene_Ontology%22:%221%22}

(因此基本上模仿网站的功能)

例如:

{%22Sequence_Paralogs%22:%221%22,%22Domains%22:%221%22,%22Super_Pathways%22:%221%22,%22Expression_Patterns%22:%221%22,%22表型%22:%221%22,%22化合物%22:%221%22,%22疾病%22:%221%22,%22基因_本体%22:%221%22}


然而,他们可能不喜欢人们以这种方式使用他们的网站(提交许多自动请求)。你可能想看看他们的政策。另外,要检查的另一件事是他们是否有一个官方API,可以用于批量检索基因信息。

谢谢您的帮助。这真的帮助了我。但是,我不知道如何在JAVA脚本中编写它。如果您能演示一下,我们将不胜感激?我需要将结果保存在一个以制表符分隔的文件中。恐怕这实际上是不合法的。查看他们的条款和条件,第26页:“学术用户同意不使用任何机器人、蜘蛛、爬虫或其他自动下载程序或设备:(i)连续自动搜索或索引任何内容,除非得到YEDA、WIS或LifeMap的授权;(ii)从我们的服务中提取数据、内容、图像;或(iii)“好的,我会发一封电子邮件询问我们是否可以访问他们的数据,仅仅用于学术目的。然而,对于我的技术问题,我们可以换到另一个网站,那就是OMIM,他们有API服务。我想这样做应该更容易些。你能提供一些关于如何做的信息吗?即使是在线资源也会很感激。ThanksA简单的bash脚本就足够了。有很多例子,例如,请看下面这一个,以获得灵感:您使用基因名称在文件中的行上循环,并调用给定的链接,使用基因名称作为变量,类似于
wget“您的url with-$genemame”>“$genename.txt”