获取在Java中不是html的字符串的一部分
在我的Java应用程序中,我有一个必须编辑的字符串。问题是这些字符串可能包含HTML标记/元素,不应编辑这些标记/元素(没有检索元素的id) 场景(添加-):获取在Java中不是html的字符串的一部分,java,html,string,parsing,substring,Java,Html,String,Parsing,Substring,在我的Java应用程序中,我有一个必须编辑的字符串。问题是这些字符串可能包含HTML标记/元素,不应编辑这些标记/元素(没有检索元素的id) 场景(添加-): String a=“text 2”; 应成为:-文本2 字符串b=“文本”; 应成为:-文本 字符串c=“t”; 应该变成:-t 我的问题是:如何检索包含html标记的字符串中的文本(无法添加id或类)您可以使用XML解析库 String newText = null; for ( Node node : document.nodes(
String a=“text 2”;
应成为:-文本2
字符串b=“文本”;
应成为:-文本
字符串c=“t”;
应该变成:-t
我的问题是:如何检索包含html标记的字符串中的文本(无法添加id或类)您可以使用XML解析库
String newText = null;
for ( Node node : document.nodes() ) {
if ( node.text() != null ) newText = "-" + node.text();
}
注意,这是伪的
newText
现在将是-text
或任何节点文本
编辑:
您的问题在“文本可以包含html元素”方面有点含糊不清
如果它不包含html标记,那么就不能使用XML解析器,这就提出了一个问题。。如果它不包含标记,那么您为什么不能直接执行
String newString = "-" + a;
您可以使用XML解析库
String newText = null;
for ( Node node : document.nodes() ) {
if ( node.text() != null ) newText = "-" + node.text();
}
注意,这是伪的
newText
现在将是-text
或任何节点文本
编辑:
您的问题在“文本可以包含html元素”方面有点含糊不清
如果它不包含html标记,那么就不能使用XML解析器,这就提出了一个问题。。如果它不包含标记,那么您为什么不能直接执行
String newString = "-" + a;
谢谢你的回答。原因是我事先不知道字符串是否包含html,谢谢你的回答。原因是我事先不知道字符串是否包含html