Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/326.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
HTML和XML解析Java_Java_Android_Html_Xml_Parsing - Fatal编程技术网

HTML和XML解析Java

HTML和XML解析Java,java,android,html,xml,parsing,Java,Android,Html,Xml,Parsing,我开始编写一个基于nutritiondata.com的android应用程序 问题是。。他们没有API供开发人员使用,这对我来说似乎非常困难和混乱,我不知道如何将信息从网站解析到我的应用程序 例如。。使用他们的食物搜索。。是我所理解的,例如鳄梨搜索: 因此,我可以在这里替换/食物-。。。。其他食物名称。。。00000000000.html 但一旦我深入了解鳄梨的详细营养成分,我就不知道如何提取特定数据,比如鳄梨中的ω3和ω6含量(单位:克)或蛋白质,我尝试使用“源页面”来寻找有用的数据,但我该

我开始编写一个基于nutritiondata.com的android应用程序

问题是。。他们没有API供开发人员使用,这对我来说似乎非常困难和混乱,我不知道如何将信息从网站解析到我的应用程序

例如。。使用他们的食物搜索。。是我所理解的,例如鳄梨搜索:

因此,我可以在这里替换/食物-。。。。其他食物名称。。。00000000000.html

但一旦我深入了解鳄梨的详细营养成分,我就不知道如何提取特定数据,比如鳄梨中的ω3和ω6含量(单位:克)或蛋白质,我尝试使用“源页面”来寻找有用的数据,但我该如何处理这些数据,代表鳄梨中ω3和ω6脂肪的含量

       <div class="clearer">
       <div class="nf1 left" id="nfacts">


         <div class="indentation"><!--Indent Nutrients--></div>

<span class="indented">Total Omega-3 fatty acids</span></div>

        <div class="nf2 left" style="width:38px;"><span id="NUTRIENT_139"></span></div>
        <div class="nf3 left" style="width:20px;"><span id="UNIT_NUTRIENT_139"></span>    </div>
        <div class="nf4 left" style="width:31px;"><span id="DV_NUTRIENT_139"></span></div>

总ω-3脂肪酸


总ω-6脂肪酸


我非常感谢您提供一个如何处理此类数据或网站的工作示例,衷心感谢您,时间/费用和帮助。

尝试使用JSOUP进行屏幕抓取,但正如其他人所指出的,这不是长期可靠的技术。

您使用的集成方法称为“屏幕抓取”,通常被认为是不可靠的技术。如果nutritiondata.com更改他们的网站外观,您的代码很容易被破坏。最好联系他们的网站,询问开发者API/其他集成方法。如果您仍然想继续,很少有html规范化库,比如tagsoup。与XSL相结合,您可以在页面内对各种各样的内容进行筛选。至少,如果您决定使用screen scrape,最好下载整个站点的脱机副本(如果这样做是合法的),请尝试查看他们的脚本-如果他们使用模板+ajax,您可以简单地复制他们的请求。检查此项
    <div class="clearer">
       <div class="nf1 left" id="nfacts">


         <div class="indentation"><!--Indent Nutrients--></div>

<span class="indented">Total Omega-6 fatty acids</span></div>

        <div class="nf2 left" style="width:38px;"><span id="NUTRIENT_140"></span></div>
        <div class="nf3 left" style="width:20px;"><span id="UNIT_NUTRIENT_140"></span></div>
        <div class="nf4 left" style="width:31px;"><span id="DV_NUTRIENT_140"></span></div>