C# Html Div(带标记和印地语Unicode)到asp.net c中的PDF#

C# Html Div(带标记和印地语Unicode)到asp.net c中的PDF#,c#,asp.net,pdf,unicode,html-to-pdf,C#,Asp.net,Pdf,Unicode,Html To Pdf,我想在ASP.NET中使用C#将内容为印地语(Unicode字符)的HTML导出为PDF。我尝试过许多不同的第三方HTML到PDF转换工具,如nReco、evopdf、hiqpdf等,。。。从印地语文本未显示或结果文本未正确呈现的角度来看,它们都无法正常工作。例如,如果我有文本“न्‍यायालय,विरूद्व,डब्‍ल्‍यु"在Unicode中,字符呈现不正确。我创建了一个HTML文件devanagari.HTML: <body> <div>न्‍यायालय,व

我想在ASP.NET中使用C#将内容为印地语(Unicode字符)的HTML
导出为PDF。我尝试过许多不同的第三方HTML到PDF转换工具,如nReco、evopdf、hiqpdf等,。。。从印地语文本未显示或结果文本未正确呈现的角度来看,它们都无法正常工作。例如,如果我有文本
“न्‍यायालय,विरूद्व,डब्‍ल्‍यु"
在Unicode中,字符呈现不正确。

我创建了一个HTML文件
devanagari.HTML

<body>
<div>न्‍यायालय,विरूद्व,डब्‍ल्‍यु</div>
</body>
在C#中,您需要这样的内容(请参阅):

然后我运行了这行代码:

HtmlConverter.convertToPdf(new File(src), new File(dest));
在C#中,这类似于:

HtmlConverter.ConvertToPdf(src, dest);
其中,
src
表示HTML,dest表示生成的PDF

从屏幕截图上可以看出,内容呈现正确。大多数其他工具都会这样呈现文本(如果它们呈现任何内容):

显然,这是不正确的,因为没有结扎


有关使用iText将HTML转换为PDF的详细信息,请参阅。例如:如果您想使用与pdfHTML(FreeSans)附带的默认字体不同的字体,您应该参考。

很少有PDF工具支持Devanagari脚本。据我所知,只有iText 7支持它与封闭源代码pdfCalligraph附加组件结合使用。的中有一个示例。示例是Java,但.NET开发人员很容易将其移植到C#。另外,请查看。不同的Indic语言都有支持是因为印度政府正在使用iText以当地语言制作出生证、结婚证等。
HtmlConverter.convertToPdf(new File(src), new File(dest));
HtmlConverter.ConvertToPdf(src, dest);