Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/xml/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Iphone 将HTML解析为XML的最佳方法_Iphone_Xml_Html Parsing - Fatal编程技术网

Iphone 将HTML解析为XML的最佳方法

Iphone 将HTML解析为XML的最佳方法,iphone,xml,html-parsing,Iphone,Xml,Html Parsing,实际上,我目前有一个iPhone应用程序,可以在我的服务器上查询和解析XML文件。现在,我每天早上都要手动更新和上传我的XML文件,这样我的用户就可以获得更新的信息。我想使这个过程自动化,这基本上需要解析各种网站(NYTimes、iampored.com等),将这些网站的相关信息输出到一个XML文件,并将该文件上载到我的服务器 有人知道实现这一点的最佳方法(将HTML解析为XML文件)吗。因为我是一个初学者,我不知道这需要什么语言,或者最好的方法是什么 提前多谢 如果需要刮取的内容是XHTML格

实际上,我目前有一个iPhone应用程序,可以在我的服务器上查询和解析XML文件。现在,我每天早上都要手动更新和上传我的XML文件,这样我的用户就可以获得更新的信息。我想使这个过程自动化,这基本上需要解析各种网站(NYTimes、iampored.com等),将这些网站的相关信息输出到一个XML文件,并将该文件上载到我的服务器

有人知道实现这一点的最佳方法(将HTML解析为XML文件)吗。因为我是一个初学者,我不知道这需要什么语言,或者最好的方法是什么


提前多谢

如果需要刮取的内容是XHTML格式的,那么您可以轻松地使用该语言将原始内容转换为提供给用户的XML中所需的内容

否则任何类型的抓取和XML生成解决方案都可以,每种编程语言都支持这样做。。但是您可以使用XPath从页面中选择所需的元素,然后将它们保存在输出文件中。

您可以尝试(XHTML基于XML,因此它是在DTD中定义了一些规则的XML)

您也可以尝试(因为XHTML基于XML,HTML基于SGML)


这些链接是作为灵感提供的。

你能从RSS/Atom提要中得到你需要的吗?这将大大简化事情,因为它们是XML而不是HTML,并且可以由标准XML解析器解析。当然,RSS提要中嵌入的描述将是HTML,因此根据您的应用程序,可能需要解析HTML

XSLT是一种为处理XML而设计的特定于领域的编程语言,但您也可以使用任何包含XML解析器的编程语言来完成此任务

…一个用Java编写的SAX兼容解析器 而不是解析格式良好的 或有效的XML,按原样解析HTML 在野外发现:贫穷、肮脏和 野蛮的,虽然经常远离 短

TagSoup是为人们设计的 谁必须用计算机处理这些东西 某种理性的外表 应用程序设计

通过提供SAX 接口,它允许标准XML 适用于最坏情况的工具 HTML。TagSoup还包括 读取HTML的命令行处理器 文件,并可以生成 HTML或格式良好的XML,它是 与XHTML非常接近


另外,

您在服务器上使用的是什么平台/语言?