Javascript 获取textcontent pdf.js

Javascript 获取textcontent pdf.js,javascript,pdf.js,Javascript,Pdf.js,我正在尝试使用js中的pdf.js从pdf文档中获取文本。但是,pdf.js没有像样的文档,我已经查看了可用的示例,并得出以下结论: var pdfUrl = "http://localhost/test.pdf" var pdf = PDFJS.getDocument(pdfUrl); pdf.then(function(pdf) { var maxPages = pdf.pdfInfo.numPages; for (var j = 1; j < maxPages; j+

我正在尝试使用js中的pdf.js从pdf文档中获取文本。但是,pdf.js没有像样的文档,我已经查看了可用的示例,并得出以下结论:

var pdfUrl = "http://localhost/test.pdf"
var pdf = PDFJS.getDocument(pdfUrl);
pdf.then(function(pdf) {
    var maxPages = pdf.pdfInfo.numPages;
    for (var j = 1; j < maxPages; j++) {
        var page = pdf.getPage(j);

        page.then(function() {
            var textContent = page.getTextContent();

        })
    }
});
var pdfUrl=”http://localhost/test.pdf"
var pdf=PDFJS.getDocument(pdfUrl);
然后(函数(pdf){
var maxPages=pdf.pdfInfo.numPages;
对于(var j=1;j
页面位正在工作,因为我可以看到它是promiss。但是,运行此位将提供:

Warning: Unhandled rejection: TypeError: Object #<Object> has no method 'getTextContent'
TypeError: Object #<Object> has no method 'getTextContent'
警告:未处理的拒绝:TypeError:Object#没有方法“getTextContent”
TypeError:对象#没有方法“getTextContent”
在我看到的例子中,它就是这样工作的。它正在获取页面,我可以打印出页面数

有没有经验的人能给我们点启示

*奖金问题:
我只对解析pdf感兴趣,而不是在浏览器中呈现它。然而,它必须在客户端完成。pdf.js是这份工作的合适人选吗?

页面。然后(function(){
应该是
页面。然后(function(page){
页面。然后(function(){
应该是
页面。然后(function(page){
页面。然后(function(){
应该是
页面。然后(function(page){/code>
页面){
应该是
页面。然后(函数(页面){

PDF.js呈现您的PDF文件并生成单词,然后将其作为html元素输出。 然后将每个元素放置在具有css属性{position:absolute;left:X,top:Y}的pdf上方,并在pdf上方屏蔽

这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧,看起来您直接从pdf文件中选择,但实际上您选择的是创建的html元素


这正是它的工作原理,如果你想呈现pdf文件,这是可以的,但请记住,如果你想更改输出技术(html透明divs),你必须带上自己的替代品…

pdf.js呈现你的pdf文件并生成单词,然后将它们作为html元素输出。 然后将每个元素放置在具有css属性{position:absolute;left:X,top:Y}的pdf上方,并在pdf上方屏蔽

这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧,看起来您直接从pdf文件中选择,但实际上您选择的是创建的html元素


这正是它的工作原理,如果你想呈现pdf文件,这是可以的,但请记住,如果你想更改输出技术(html透明divs),你必须带上自己的替代品…

pdf.js呈现你的pdf文件并生成单词,然后将它们作为html元素输出。 然后将每个元素放置在具有css属性{position:absolute;left:X,top:Y}的pdf上方,并在pdf上方屏蔽

这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧,看起来您直接从pdf文件中选择,但实际上您选择的是创建的html元素


这正是它的工作原理,如果你想呈现pdf文件,这是可以的,但请记住,如果你想更改输出技术(html透明divs),你必须带上自己的替代品…

pdf.js呈现你的pdf文件并生成单词,然后将它们作为html元素输出。 然后将每个元素放置在具有css属性{position:absolute;left:X,top:Y}的pdf上方,并在pdf上方屏蔽

这些div被赋予css属性{color:transparent}。这实现了选择高亮显示的技巧,看起来您直接从pdf文件中选择,但实际上您选择的是创建的html元素


这正是它的工作原理,如果您想呈现pdf文件,这是可以的,但请记住,如果您想更改输出技术(html透明divs),您必须带上您自己的替代品…

您还需要将其更改为

for (var j = 1; j <= maxPages; j++) {

for(var j=1;j您还需要将其更改为

for (var j = 1; j <= maxPages; j++) {

for(var j=1;j您还需要将其更改为

for (var j = 1; j <= maxPages; j++) {

for(var j=1;j您还需要将其更改为

for (var j = 1; j <= maxPages; j++) {

for(var j=1;j可能不是问题,但是
page。然后(function(){
应该是
page。然后(function(page){
这实际上是问题!回答这个问题,你就完成了。可能不是问题,但是
page。然后(function(){/code>应该是
page。然后(function(){
应该是
page)。然后(function(page){
这实际上是个问题!回答这个问题,你就完成了。可能不是问题,而是
页面。然后(函数(){
应该是
页面。然后(函数(页面){
这实际上是个问题!回答这个问题,你就完成了。可能不是问题,但是
页面。然后(函数(){
应该是
页面。然后(函数(页面){
这实际上就是问题所在!回答这个问题,你就完了。