Python 为什么pdfkit在将网页转换为pdf时编辑不同语言的文本?
这是我的密码:Python 为什么pdfkit在将网页转换为pdf时编辑不同语言的文本?,python,python-3.x,pdf,pdfkit,Python,Python 3.x,Pdf,Pdfkit,这是我的密码: 导入请求 将pdfkit作为pk导入 从bs4导入BeautifulSoup作为bs def save_PDF(url): html=session.get(url) soup=bs(html.content,'html.parser') title=str(soup.find('title').string) 如果“(”在标题中: title=title.split(“(”)[0] 其他: title=title.split(“|”)[0] 打印(“保存”+标题) HTMLIT
导入请求
将pdfkit作为pk导入
从bs4导入BeautifulSoup作为bs
def save_PDF(url):
html=session.get(url)
soup=bs(html.content,'html.parser')
title=str(soup.find('title').string)
如果“(”在标题中:
title=title.split(“(”)[0]
其他:
title=title.split(“|”)[0]
打印(“保存”+标题)
HTMLITLE=标题+“.html”
pdf=open(htmlTitle,'wb+')
pdf.write(html.content)
pdf.close()
pdfTitle=标题+“.pdf”
pk.from_文件(htmlTitle,pdfTitle)
以下是输出:这些黑匣子下面的行是用孟加拉语写的 如何解决此问题?
有其他选择吗?您可能不会向PDF处理器公开包含孟加拉语字符的字体。如何解决此问题?@KevinBrownPerhaps查看此问题……是否知道如何为多个HTML文件定义孟加拉语和英语的多个字体?通常情况下,您会使用带有逗号分隔字体列表的字体系列。