HTML和XML解析Java
我开始编写一个基于nutritiondata.com的android应用程序 问题是。。他们没有API供开发人员使用,这对我来说似乎非常困难和混乱,我不知道如何将信息从网站解析到我的应用程序 例如。。使用他们的食物搜索。。是我所理解的,例如鳄梨搜索: 因此,我可以在这里替换/食物-。。。。其他食物名称。。。00000000000.html 但一旦我深入了解鳄梨的详细营养成分,我就不知道如何提取特定数据,比如鳄梨中的ω3和ω6含量(单位:克)或蛋白质,我尝试使用“源页面”来寻找有用的数据,但我该如何处理这些数据,代表鳄梨中ω3和ω6脂肪的含量HTML和XML解析Java,java,android,html,xml,parsing,Java,Android,Html,Xml,Parsing,我开始编写一个基于nutritiondata.com的android应用程序 问题是。。他们没有API供开发人员使用,这对我来说似乎非常困难和混乱,我不知道如何将信息从网站解析到我的应用程序 例如。。使用他们的食物搜索。。是我所理解的,例如鳄梨搜索: 因此,我可以在这里替换/食物-。。。。其他食物名称。。。00000000000.html 但一旦我深入了解鳄梨的详细营养成分,我就不知道如何提取特定数据,比如鳄梨中的ω3和ω6含量(单位:克)或蛋白质,我尝试使用“源页面”来寻找有用的数据,但我该
<div class="clearer">
<div class="nf1 left" id="nfacts">
<div class="indentation"><!--Indent Nutrients--></div>
<span class="indented">Total Omega-3 fatty acids</span></div>
<div class="nf2 left" style="width:38px;"><span id="NUTRIENT_139"></span></div>
<div class="nf3 left" style="width:20px;"><span id="UNIT_NUTRIENT_139"></span> </div>
<div class="nf4 left" style="width:31px;"><span id="DV_NUTRIENT_139"></span></div>
总ω-3脂肪酸
总ω-6脂肪酸
我非常感谢您提供一个如何处理此类数据或网站的工作示例,衷心感谢您,时间/费用和帮助。尝试使用JSOUP进行屏幕抓取,但正如其他人所指出的,这不是长期可靠的技术。您使用的集成方法称为“屏幕抓取”,通常被认为是不可靠的技术。如果nutritiondata.com更改他们的网站外观,您的代码很容易被破坏。最好联系他们的网站,询问开发者API/其他集成方法。如果您仍然想继续,很少有html规范化库,比如tagsoup。与XSL相结合,您可以在页面内对各种各样的内容进行筛选。至少,如果您决定使用screen scrape,最好下载整个站点的脱机副本(如果这样做是合法的),请尝试查看他们的脚本-如果他们使用模板+ajax,您可以简单地复制他们的请求。检查此项
<div class="clearer">
<div class="nf1 left" id="nfacts">
<div class="indentation"><!--Indent Nutrients--></div>
<span class="indented">Total Omega-6 fatty acids</span></div>
<div class="nf2 left" style="width:38px;"><span id="NUTRIENT_140"></span></div>
<div class="nf3 left" style="width:20px;"><span id="UNIT_NUTRIENT_140"></span></div>
<div class="nf4 left" style="width:31px;"><span id="DV_NUTRIENT_140"></span></div>