Docker 如何在libreoffice6.4中将pdf转换为docx?

Docker 如何在libreoffice6.4中将pdf转换为docx?,docker,libreoffice,libreoffice-writer,Docker,Libreoffice,Libreoffice Writer,我的ubuntu 18.04容器中安装了libreoffice6.4 目标是将pdf文件转换为docx 我已经尝试了以下命令: libreoffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" /pdf/pdf.pdf --outdir /pdf libreoffice --headless --convert-to docx:"Microsoft Word 2007-2013

我的ubuntu 18.04容器中安装了libreoffice6.4

目标是将pdf文件转换为docx

我已经尝试了以下命令:

libreoffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:"Microsoft Word 2007-2013 XML" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:"MS Word 2007 XML" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:writer_MS_Word_97 /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to "docx:writer_MS_Word_2007" /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to docx:writer_OOXML /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to doc /pdf/pdf.pdf --outdir /pdf

libreoffice --headless --convert-to "docx:writer_MS_Word_2007" --outdir /pdf pdf.pdf
但他们总是会回复这样的信息:

convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : writer_MS_Word_2007
Overwriting: /pdf/pdf.docx
Error: Please verify input parameters... (SfxBaseModel::impl_store <file:///pdf/pdf.docx> failed: 0x81a(Error Area:Io Class:Parameter Code:26))
convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : Office Open XML Text
Overwriting: /pdf/pdf.docx
它返回了以下消息:

convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : writer_MS_Word_2007
Overwriting: /pdf/pdf.docx
Error: Please verify input parameters... (SfxBaseModel::impl_store <file:///pdf/pdf.docx> failed: 0x81a(Error Area:Io Class:Parameter Code:26))
convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : Office Open XML Text
Overwriting: /pdf/pdf.docx
我可以看到它需要-infilter-parameter,因为输入文件是pdf

但是,它使用的是Office Open XML文本过滤器,我需要将其切换到Microsoft Word 2007-2013 XML,我如何才能做到这一点

我已经试过了,但不起作用:

libreoffice --infilter="writer_pdf_import" --convert-to docx:"Microsoft Word 2007-2013 XML"  --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to "docx:Microsoft Word 2007-2013 XML"  --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to "docx:writer_MS_Word_2007"  --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to docx:"writer_MS_Word_2007"  --outdir /pdf /pdf/pdf.pdf

libreoffice --infilter="writer_pdf_import" --convert-to docx:writer_MS_Word_2007  --outdir /pdf /pdf/pdf.pdf
他们总是返回与上面相同的消息:

convert /pdf/pdf.pdf -> /pdf/pdf.docx using filter : writer_MS_Word_2007
Overwriting: /pdf/pdf.docx
Error: Please verify input parameters... (SfxBaseModel::impl_store <file:///pdf/pdf.docx> failed: 0x81a(Error Area:Io Class:Parameter Code:26))

我终于想出了解决办法

希望这对任何有同样问题的人都有用

我做了一个实验,通过一个接一个地尝试可能的单词过滤器,有4次成功的尝试

libreoffice --headless --infilter="writer_pdf_import" --convert-to docx  --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter='writer_pdf_import' --convert-to docx:"MS Word 2007 XML" --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter='writer_pdf_import' --convert-to doc:"MS Word 2007 XML" --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter="writer_pdf_import" --convert-to doc  --outdir /pdf /pdf/pdf.pdf
但在这4个命令中,最后一个命令的效果最好,转换后的文档文件内容与原始文件内容相似,仅供参考,我的文档中有一些汉字和表格,前3个命令没有正确绘制表格边框,而最后一个命令则正确绘制了表格边框

更新:

我决定在ubuntu 18.04容器上安装libreoffice 7.0

要查看过滤器的详细列表,请转到,然后打开其中一个xcu文件,过滤器详细信息应该在那里,要使用它,只需从“名称”属性中选择,并按如下方式使用:

libreoffice --headless --infilter='writer_pdf_import' --convert-to doc:"<enter_filter_name_here>" --outdir /pdf /pdf/pdf.pdf

我终于想出了解决办法

希望这对任何有同样问题的人都有用

我做了一个实验,通过一个接一个地尝试可能的单词过滤器,有4次成功的尝试

libreoffice --headless --infilter="writer_pdf_import" --convert-to docx  --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter='writer_pdf_import' --convert-to docx:"MS Word 2007 XML" --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter='writer_pdf_import' --convert-to doc:"MS Word 2007 XML" --outdir /pdf /pdf/pdf.pdf

libreoffice --headless --infilter="writer_pdf_import" --convert-to doc  --outdir /pdf /pdf/pdf.pdf
但在这4个命令中,最后一个命令的效果最好,转换后的文档文件内容与原始文件内容相似,仅供参考,我的文档中有一些汉字和表格,前3个命令没有正确绘制表格边框,而最后一个命令则正确绘制了表格边框

更新:

我决定在ubuntu 18.04容器上安装libreoffice 7.0

要查看过滤器的详细列表,请转到,然后打开其中一个xcu文件,过滤器详细信息应该在那里,要使用它,只需从“名称”属性中选择,并按如下方式使用:

libreoffice --headless --infilter='writer_pdf_import' --convert-to doc:"<enter_filter_name_here>" --outdir /pdf /pdf/pdf.pdf