Java ășț;使用PdfWriter从html生成的pdf中缺少字符

Java ășț;使用PdfWriter从html生成的pdf中缺少字符,java,html,pdf,itext,pdf-writer,Java,Html,Pdf,Itext,Pdf Writer,我正在尝试使用itext PdfWriter将一些html内容转换为pdf,如下所示: Document document = new Document(); ByteArrayOutputStream outputStream = new ByteArrayOutputStream(); PdfWriter writer = PdfWriter.getInstance(document, outputStream); document.open(); InputStream stream =

我正在尝试使用itext PdfWriter将一些html内容转换为pdf,如下所示:

Document document = new Document();
ByteArrayOutputStream outputStream = new ByteArrayOutputStream();
PdfWriter writer = PdfWriter.getInstance(document, outputStream);
document.open();
InputStream stream = new ByteArrayInputStream(content.getBytes(StandardCharsets.UTF_8));
XMLWorkerHelper.getInstance().parseXHtml(writer, document, stream, Charset.forName("UTF-8"));
document.close();
但生成的pdf中缺少ășț字符。我尝试过设置编码或字体,但没有成功。我尝试的是使用字体提供程序并将其设置为parseXHtml方法的参数

我设置了编码,但没有改变

XMLWorkerFontProvider fontProvider = new XMLWorkerFontProvider();
fontProvider.setUseUnicode(true);
fontProvider.defaultEncoding = BaseFont.CP1257;
我也尝试过设置字体,但它没有应用到pdf

XMLWorkerFontProvider fontProvider = new XMLWorkerFontProvider(XMLWorkerFontProvider.DONTLOOKFORFONTS);
fontProvider.register(PATH_TO_TTF_FONT_FILE_HOSTED_ON_S3);
然后为parseXHtml设置参数

XMLWorkerHelper.getInstance().parseXHtml(writer, document, stream, Charset.forName("UTF-8"), fontProvider);

我是否可以使用PdfWriter将所有字符从html正确转换为pdf?

UTF-8,您正在使用,如果没有这些字符,请尝试UTF-16。@res我已将UTF8替换为UTF16,没有任何更改:(@res:…不,UTF-8完全可以用Unicode编码所有可能的字符。
ă
,例如,被编码为。很可能使用的字体没有这些字符。@res实际上这个页面本身是用UTF-8编码的(至少对我来说)我可以看到符号…@aniri你能分享一下它的HTML或抽象版本吗,这样我们就可以处理它了?