Java 有没有办法用JSoup只格式化一些特殊字符?

Java 有没有办法用JSoup只格式化一些特殊字符?,java,html,string,jsoup,Java,Html,String,Jsoup,使用有一种方法只能清除某些字符。例如,我希望将替换为空格,“替换为实际的引号,但我不希望删除或替换任何,等。我不希望提取所有html,因为它与: Jsoup.parse(html).text() 相反,我想做的是为它提供一个列表,可能是一个数组,其中包含我想要解析和清理的编码,例如“等等。Jsoup确实提供了。但是,它们只能删除元素或属性 相反,您可以在此处浏览元素文本并进行替换 试试这个: public static void formatDocument(Document doc, Str

使用有一种方法只能清除某些字符。例如,我希望将
替换为空格,
替换为实际的引号,但我不希望删除或替换任何

等。我不希望提取所有html,因为它与:

Jsoup.parse(html).text()
相反,我想做的是为它提供一个列表,可能是一个数组,其中包含我想要解析和清理的编码,例如
等等。

Jsoup确实提供了。但是,它们只能删除元素或属性

相反,您可以在此处浏览元素文本并进行替换

试试这个:

public static void formatDocument(Document doc, String[] encodings, String[] replacements) {
   // FIXME: Check that encodings and replacements have same size...

   Elements allElements = doc.select("*");
   int encodingsCount = encodings.length;

     for(Element anElement : allElements) {
         String textElement = anElement.ownText();

         for(int i=0; i<encodingsCount; i++) {
             textElement = textElement.replace(encodings[i], replacements[i]);
         }

         anElement.text(textElemement);
     }
}
公共静态void formatDocument(文档文档、字符串[]编码、字符串[]替换){
//修正:检查编码和替换的大小是否相同。。。
Elements Allegments=doc.select(“*”);
int encodingscont=encodings.length;
对于(元素A元素:等位基因){
字符串textElement=anElement.ownText();
对于(inti=0;iJsoup确实提供了。但是,它们只能删除元素或属性

相反,您可以在此处浏览元素文本并进行替换

试试这个:

public static void formatDocument(Document doc, String[] encodings, String[] replacements) {
   // FIXME: Check that encodings and replacements have same size...

   Elements allElements = doc.select("*");
   int encodingsCount = encodings.length;

     for(Element anElement : allElements) {
         String textElement = anElement.ownText();

         for(int i=0; i<encodingsCount; i++) {
             textElement = textElement.replace(encodings[i], replacements[i]);
         }

         anElement.text(textElemement);
     }
}
公共静态void formatDocument(文档文档、字符串[]编码、字符串[]替换){
//修正:检查编码和替换的大小是否相同。。。
Elements Allegments=doc.select(“*”);
int encodingscont=encodings.length;
对于(元素A元素:等位基因){
字符串textElement=anElement.ownText();
对于(int i=0;i