Javascript 在使用pdf.js的pdf到文本转换中将换行符显示为“\n”
我使用本教程中的代码设置pdf到文本的转换 在这个网站上到处寻找一些关于如何格式化转换的提示,但是找不到任何东西。我只是想知道,在使用pdf.js解析文本时,是否有人知道如何将换行符显示为Javascript 在使用pdf.js的pdf到文本转换中将换行符显示为“\n”,javascript,pdf,pdf.js,pdftotext,Javascript,Pdf,Pdf.js,Pdftotext,我使用本教程中的代码设置pdf到文本的转换 在这个网站上到处寻找一些关于如何格式化转换的提示,但是找不到任何东西。我只是想知道,在使用pdf.js解析文本时,是否有人知道如何将换行符显示为\n 提前谢谢 在PDF中,不存在使用控制字符控制布局的情况,例如“\n”-PDF中使用精确坐标定位的标志符号。使用文本y坐标(可从变换矩阵中提取)检测线条变化 var url=”https://cdn.mozilla.net/pdfjs/tracemonkey.pdf"; var pageNumber=2;
\n
提前谢谢 在PDF中,不存在使用控制字符控制布局的情况,例如“\n”-PDF中使用精确坐标定位的标志符号。使用文本y坐标(可从变换矩阵中提取)检测线条变化
var url=”https://cdn.mozilla.net/pdfjs/tracemonkey.pdf";
var pageNumber=2;
//加载文档
PDFJS.getDocument(url).then(函数(doc){
//翻页
退货单据获取页面(页码);
}).then(功能(pdfPage){
//获取页面文本内容
返回pdfPage.getTextContent();
}).then(函数(文本内容){
var p=null;
变量lastY=-1;
textContent.items.forEach(函数(i){
//跟踪Y坐标,如果更改,则创建新的p标签
if(lastY!=i.transform[5]){
p=document.createElement(“p”);
文件.正文.附件(p);
lastY=i.transform[5];
}
p、 textContent+=i.str;
});
});代码>
您是否尝试过将任何\r
替换为\\r
,将\n
替换为\\n
之类的字符串。替换('\r','\\r')。替换('\n','\\n')代码>?,注意:对于那些不知道\r
(回车符)在某些环境(如windows)中通常与换行符配对的人,是的,我试过了。除非\n
不存在。我担心pdf.js会忽略新行字符。