使用真实HTML进行Scala XML解析（带有不匹配的标记）_Html_Xml_Scala - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/71.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用真实HTML进行Scala XML解析（带有不匹配的标记）_Html_Xml_Scala - Fatal编程技术网

使用真实HTML进行Scala XML解析（带有不匹配的标记）

html xml scala

使用真实HTML进行Scala XML解析（带有不匹配的标记）,html,xml,scala,Html,Xml,Scala,我的应用程序正在尝试将html文档嵌入到XML文档中 val xml = <document> <id> { getId } </id> <content> { getContent } </content> </document> val xml= {getId} {getContent} getId是一个返回新序列号的简单函数。问题是关于getContent： def

我的应用程序正在尝试将html文档嵌入到XML文档中

val xml = 
  <document>
    <id> { getId } </id>
    <content> 
      { getContent }
    </content>
  </document>

val xml=
{getId}
{getContent}

getId是一个返回新序列号的简单函数。问题是关于getContent：

def getContent = {
  val wrapped = "<wrap>"+article.content+"</wrap>"
  XML.loadString(wrapped).child
}

def getContent={
val wrapped=”“+文章内容+“”
loadString（wrapped）.child
}

如您所见，article.content返回一个存储真实HTML文档的字符串。 Scala.xml.xml.loadString函数将把它解析为xml，并返回一个子元素列表，并正确地嵌入到xml val中

但是，当只有html有效时，例如，

Hello world

在一些文章中，它可能会出现：

helloworld

缺少
元素的结束标记。（是的，我不能责怪用户！）
在这种情况下，它将在此解析中引发异常并停止应用程序
有没有什么方法可以绕过验证，或者干脆将HTML作为字符串嵌入XML文档中而不进行解析
请解释一下这种情况。欢迎任何建议。
JSoup和TagSoup（以及其他）都适用于传递格式不好的XML的HTML

您必须决定哪个最适合您自己的用例。
您应该使用
html
解析器，而不是
xml
解析器。我更喜欢。您可以将html字符串解析为
scala
xml
如下：
new scala.xml.parsing.NoBindingFactoryAdapter（）.loadXML（源代码，new org.ccil.cowan.tagsoup.jaxp.saxfactorympl（）.newSAXParser（））
对于tagsoup，下面的链接可供参考。

[xml]相关文章推荐

Xml XSL：计算以前的唯一同级 xml xslt xpath

在VXML中增加一个计数器 xml

如何使用flex获取xml中父节点下的所有子节点？ xml apache-flex flash adobe

使用XSLT转换XML的帮助：分组和选择具有最大值的元素 xml xslt

使用XSL转换将XML转换为CSV xml xslt csv

SQL Server 2008：从结果集中检索XML列值并将其存储在文档中 xml sql-server-2008

XML语法错误？ xml

Xml 使用XSLT<；xsl:element>；然后逐字声明元素？ xml xslt

Xml XQuery-连接查询 xml join xquery

Xml 我需要对文档进行可视化建模，然后生成一些POCO、EF设计器或类图？ xml asp.net-mvc-3 entity-framework-4

Golang结构的XML和JSON标记？ xml json encoding go

Xml RestTemplate和soap解组器 xml spring soap jaxb

Xml 使用R将新数据附加到格式化的xlsx工作表 xml r excel formatting

指定要在变量中读取的XML标记 xml powershell

解析XML时出现未指定的错误-2147467259 xml vbscript asp-classic

Xml BizTalk接收端口生成额外的空文件 xml biztalk

Xml 我可以将Visual Studio代码段与特定的文件类型相关联吗？ xml visual-studio-code

使用XSLT将具有多个输出的XML转换为具有单个输出的XML xml xslt

为什么我的XSLT被忽略了？XML输出没有变化 xml xslt

Xml PhoneGap-为语言和#x27；欧洲联盟'；但未找到默认语言的资源：'；美国'； xml cordova flask

随机文章推荐

SignalR-如何将客户端重新连接到服务器（如何重新启动SignalR） signalr

Signalr 信号器客户端是否接收到未订阅的消息？ signalr

Signalr 在信号器中向断开连接的客户端发送消息时出现异常 signalr

Signalr 信号器和ASP.NET标识过期时间span signalr

Signalr 信号器外部服务定时循环-服务器或客户端 signalr

Signalr 信号员性能 signalr

Signalr $.hubConnection未定义 signalr

Signalr 信号服务器API和其他平台 signalr

Signalr 信号员定期断开 signalr

Signalr 从应用程序洞察中筛选出信号器请求 signalr

Signalr HubCallerContext中的信号器缺少连接 signalr

[html]相关推荐

Tags

Racket Soap Jqgrid Jaxb Winforms Chart.js Cloud Spotify Clearcase Cygwin Sql Server Zsh Sap Ignite Openshift Sed Raspberry Pi Mips Jsf Openlayers Actionscript Debugging Telegram Gnuplot Grafana Logstash Keras Crystal Reports Triggers Sharepoint 2007 Asp.net Mvc Printing Automation Dictionary Menu Tfs Utf 8 Ocaml Keyboard Breeze Apache Camel Vagrant Testing Arrays Enums Twig Text Scheme Android Emulator Rxjs Html Delphi Symfony Google Analytics Merge Machine Learning Asp.net Core Mvc Usb Tcl C++ Cli Magento2 Centos Yii2 Apache Flink Apache Nifi Routes Asp.net Mvc 4 Curl C++ Google Cloud Platform Sdk Safari Liferay Hazelcast Installation Amazon Redshift Memory Management Python Templates Single Sign On Streaming String Netty Jdbc Cakephp Coffeescript Seo Doctrine Orm Parameters Bootstrap 4 Xamarin.android Email Acumatica Webpack Junit Azure Data Factory Material Ui Makefile Jquery Activemq Pascal Graphviz Pandas Google Drive Api Migration C# 3.0 D3.js Image Processing Jestjs Xna Svg Jboss Woocommerce Dynamics Crm Asp.net Mvc 2 C# 4.0 Apache Kafka Database Azure Functions Karate Passwords Lotus Notes Sparql Ruby On Rails Excel Drupal 6 Clang Report Wolfram Mathematica Gmail Webgl Atom Editor Reactjs Graphics Lucene Azure Sql Database Cron Google Colaboratory Unicode Encryption Xamarin Joomla Ravendb Couchdb Localization Wcf Sprite Kit Http Meteor Sql Server 2008 Codeigniter Postgresql Nestjs System Verilog Exception Telerik Glsl Playframework Rdf Cuda Swift Rest Smtp R Youtube Api Shiny Kdb Mfc Biztalk Hbase Jasper Reports Aurelia Xamarin.ios Dataframe Core Data Silverlight 4.0 Firefox Google Plus Nsis Arduino Pdf Random Paypal Couchbase Applescript Sonarqube Gtk Date Oracle Workflow Exception Handling Spring Boot Responsive Design Puppet Azure Service Fabric Ionic Framework Intellij Idea Perforce Ansible Backbone.js Sorting

Copyright © 2024. All Rights Reserved by - Fatal编程技术网