Iphone 将HTML解析为XML的最佳方法
实际上,我目前有一个iPhone应用程序,可以在我的服务器上查询和解析XML文件。现在,我每天早上都要手动更新和上传我的XML文件,这样我的用户就可以获得更新的信息。我想使这个过程自动化,这基本上需要解析各种网站(NYTimes、iampored.com等),将这些网站的相关信息输出到一个XML文件,并将该文件上载到我的服务器 有人知道实现这一点的最佳方法(将HTML解析为XML文件)吗。因为我是一个初学者,我不知道这需要什么语言,或者最好的方法是什么Iphone 将HTML解析为XML的最佳方法,iphone,xml,html-parsing,Iphone,Xml,Html Parsing,实际上,我目前有一个iPhone应用程序,可以在我的服务器上查询和解析XML文件。现在,我每天早上都要手动更新和上传我的XML文件,这样我的用户就可以获得更新的信息。我想使这个过程自动化,这基本上需要解析各种网站(NYTimes、iampored.com等),将这些网站的相关信息输出到一个XML文件,并将该文件上载到我的服务器 有人知道实现这一点的最佳方法(将HTML解析为XML文件)吗。因为我是一个初学者,我不知道这需要什么语言,或者最好的方法是什么 提前多谢 如果需要刮取的内容是XHTML格
提前多谢 如果需要刮取的内容是XHTML格式的,那么您可以轻松地使用该语言将原始内容转换为提供给用户的XML中所需的内容 否则任何类型的抓取和XML生成解决方案都可以,每种编程语言都支持这样做。。但是您可以使用XPath从页面中选择所需的元素,然后将它们保存在输出文件中。您可以尝试(XHTML基于XML,因此它是在DTD中定义了一些规则的XML) 您也可以尝试(因为XHTML基于XML,HTML基于SGML)
这些链接是作为灵感提供的。你能从RSS/Atom提要中得到你需要的吗?这将大大简化事情,因为它们是XML而不是HTML,并且可以由标准XML解析器解析。当然,RSS提要中嵌入的描述将是HTML,因此根据您的应用程序,可能需要解析HTML XSLT是一种为处理XML而设计的特定于领域的编程语言,但您也可以使用任何包含XML解析器的编程语言来完成此任务 …一个用Java编写的SAX兼容解析器 而不是解析格式良好的 或有效的XML,按原样解析HTML 在野外发现:贫穷、肮脏和 野蛮的,虽然经常远离 短 TagSoup是为人们设计的 谁必须用计算机处理这些东西 某种理性的外表 应用程序设计 通过提供SAX 接口,它允许标准XML 适用于最坏情况的工具 HTML。TagSoup还包括 读取HTML的命令行处理器 文件,并可以生成 HTML或格式良好的XML,它是 与XHTML非常接近
另外,您在服务器上使用的是什么平台/语言?