Java 阅读和分析另一个网页上的数据并插入到我的网页上
我试图做一个简单的网页,获得足球联赛表的数据 例如,我想阅读积分栏,然后将其除以玩过的游戏数,得到每场游戏的平均积分,然后打印到我的网页上 我如何在网上做这件事 我对离线程序(如C/Matlab)很有经验,但我不知道从哪里开始在线学习Java 阅读和分析另一个网页上的数据并插入到我的网页上,java,html,matlab,web-scraping,Java,Html,Matlab,Web Scraping,我试图做一个简单的网页,获得足球联赛表的数据 例如,我想阅读积分栏,然后将其除以玩过的游戏数,得到每场游戏的平均积分,然后打印到我的网页上 我如何在网上做这件事 我对离线程序(如C/Matlab)很有经验,但我不知道从哪里开始在线学习 谢谢我不建议在客户端(在浏览器上)这样做。在服务器端(例如使用java)执行以下步骤将更容易废弃: 抓取网页内容(skysports) 将现有html标记与正则表达式一起使用以定位所需的内容部分 使用正则表达式剥离/拆分html标记以获取记录(tr)和字段(td
谢谢我不建议在客户端(在浏览器上)这样做。在服务器端(例如使用java)执行以下步骤将更容易废弃:
$.get('http://www.skysports.com/football/league/0,19540,11660,00.html', function(data) {
//do the parsing here
});
有几种编程语言能够获取这些信息,PHP将是使用curl或file\u get\u contents和正则表达式解析提取所需位的经典方法。如果您的web主机不允许远程URL检索,您也可以使用Yahoo Pipes
如果Java团队中没有人能提供更好的东西,请与我联系,我将用PHP为您编写一些粗略的代码。Perl是一个很好的Web垃圾处理和解析html或xml的工具。我已经为许多网站做了您想要做的事情,所有这些都是使用LWP::Simple package和basic regexp pattern Matching使用perl完成的。如果我们推荐其他语言,那么Python和Ruby都有许多优秀的包用于此目的:)抱歉,没有看到java标记。我以为他在找一般的网络垃圾选项。标签很差的问题?从来没有听说过Matlab用于刮削。。