Javascript 获取textcontent pdf.js_Javascript_Pdf.js

Javascript 获取textcontent pdf.js

javascript

Javascript 获取textcontent pdf.js,javascript,pdf.js,Javascript,Pdf.js,我正在尝试使用js中的pdf.js从pdf文档中获取文本。但是，pdf.js没有像样的文档，我已经查看了可用的示例，并得出以下结论： var pdfUrl = "http://localhost/test.pdf" var pdf = PDFJS.getDocument(pdfUrl); pdf.then(function(pdf) { var maxPages = pdf.pdfInfo.numPages; for (var j = 1; j < maxPages; j+

我正在尝试使用js中的pdf.js从pdf文档中获取文本。但是，pdf.js没有像样的文档，我已经查看了可用的示例，并得出以下结论：

var pdfUrl = "http://localhost/test.pdf"
var pdf = PDFJS.getDocument(pdfUrl);
pdf.then(function(pdf) {
    var maxPages = pdf.pdfInfo.numPages;
    for (var j = 1; j < maxPages; j++) {
        var page = pdf.getPage(j);

        page.then(function() {
            var textContent = page.getTextContent();

        })
    }
});

var pdfUrl=”http://localhost/test.pdf"
var pdf=PDFJS.getDocument（pdfUrl）；
然后（函数（pdf）{
var maxPages=pdf.pdfInfo.numPages；
对于（var j=1；j


页面位正在工作，因为我可以看到它是promiss。但是，运行此位将提供：
Warning: Unhandled rejection: TypeError: Object #<Object> has no method 'getTextContent'
TypeError: Object #<Object> has no method 'getTextContent'

警告：未处理的拒绝：TypeError:Object#没有方法“getTextContent”
TypeError:对象#没有方法“getTextContent”

在我看到的例子中，它就是这样工作的。它正在获取页面，我可以打印出页面数
有没有经验的人能给我们点启示
*奖金问题：
我只对解析pdf感兴趣，而不是在浏览器中呈现它。然而，它必须在客户端完成。pdf.js是这份工作的合适人选吗？
页面。然后（function（）{
应该是页面。然后（function（page）{
页面。然后（function（）{
应该是页面。然后（function（page）{
页面。然后（function（）{
应该是页面。然后（function（page）{/code>页面）{
应该是页面。然后（函数（页面）{
PDF.js呈现您的PDF文件并生成单词，然后将其作为html元素输出。
然后将每个元素放置在具有css属性{position:absolute；left:X，top:Y}的pdf上方，并在pdf上方屏蔽
这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧，看起来您直接从pdf文件中选择，但实际上您选择的是创建的html元素
这正是它的工作原理，如果你想呈现pdf文件，这是可以的，但请记住，如果你想更改输出技术（html透明divs），你必须带上自己的替代品…pdf.js呈现你的pdf文件并生成单词，然后将它们作为html元素输出。
然后将每个元素放置在具有css属性{position:absolute；left:X，top:Y}的pdf上方，并在pdf上方屏蔽
这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧，看起来您直接从pdf文件中选择，但实际上您选择的是创建的html元素
这正是它的工作原理，如果你想呈现pdf文件，这是可以的，但请记住，如果你想更改输出技术（html透明divs），你必须带上自己的替代品…pdf.js呈现你的pdf文件并生成单词，然后将它们作为html元素输出。
然后将每个元素放置在具有css属性{position:absolute；left:X，top:Y}的pdf上方，并在pdf上方屏蔽
这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧，看起来您直接从pdf文件中选择，但实际上您选择的是创建的html元素
这正是它的工作原理，如果你想呈现pdf文件，这是可以的，但请记住，如果你想更改输出技术（html透明divs），你必须带上自己的替代品…pdf.js呈现你的pdf文件并生成单词，然后将它们作为html元素输出。
然后将每个元素放置在具有css属性{position:absolute；left:X，top:Y}的pdf上方，并在pdf上方屏蔽
这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧，看起来您直接从pdf文件中选择，但实际上您选择的是创建的html元素
这正是它的工作原理，如果您想呈现pdf文件，这是可以的，但请记住，如果您想更改输出技术（html透明divs），您必须带上您自己的替代品…
您还需要将其更改为
for (var j = 1; j <= maxPages; j++) {

for（var j=1；j您还需要将其更改为
for (var j = 1; j <= maxPages; j++) {

for（var j=1；j您还需要将其更改为
for (var j = 1; j <= maxPages; j++) {

for（var j=1；j您还需要将其更改为
for (var j = 1; j <= maxPages; j++) {

for（var j=1；j可能不是问题，但是page。然后（function（）{
应该是page。然后（function（page）{
这实际上是问题！回答这个问题，你就完成了。可能不是问题，但是page。然后（function（）{/code>应该是page。然后（function（）{
应该是page）。然后（function（page）{
这实际上是个问题！回答这个问题，你就完成了。可能不是问题，而是页面。然后（函数（）{
应该是页面。然后（函数（页面）{
这实际上是个问题！回答这个问题，你就完成了。可能不是问题，但是页面。然后（函数（）{
应该是页面。然后（函数（页面）{
这实际上就是问题所在！回答这个问题，你就完了。