使用python查找和替换多个文档(.doc)中的图像
我有一个名为InputFiles的文件夹,其中有多个.doc类型的文件,每个文件中都有一个图像。我希望python转到每个文档搜索,找到并替换一个图像,然后将文档保存在OutputFiles中。代码当前打开并保存文档(如果是.rft),但不会保存图像,只保存文档。我如何让它与.doc一起工作,并做我需要它做的事情 图像文件保存在名为Pictures的文件夹中,图片名为HR_simo.png使用python查找和替换多个文档(.doc)中的图像,python,docx,Python,Docx,我有一个名为InputFiles的文件夹,其中有多个.doc类型的文件,每个文件中都有一个图像。我希望python转到每个文档搜索,找到并替换一个图像,然后将文档保存在OutputFiles中。代码当前打开并保存文档(如果是.rft),但不会保存图像,只保存文档。我如何让它与.doc一起工作,并做我需要它做的事情 图像文件保存在名为Pictures的文件夹中,图片名为HR_simo.png import os from docx import Document document = Docume
import os
from docx import Document
document = Document()
sourcepath = os.listdir ('InputFiles/')
for file in sourcepath:
inputfile = 'InputFiles/' +file
with open (inputfile, 'r') as inputfile:
filedata = inputfile.read()
document.add_picture('Pictures/HR_Simo.png', width=Inches(1.25))
destinationpath ='OutputFiles/' +file
with open(destinationpath, 'w') as file:
file.write(filedata)
粘贴源代码很容易(正确粘贴很重要,尤其是在缩进很重要的Python中):只需将其复制/粘贴到编辑器中,高亮显示并按Ctrl-K。关于您的问题:这个
docx
模块是什么?是否确实需要它来修改.doc
文件,而不是.docx
文件?另外,您的代码根本不修改文件数据
,因此它不包含图像也就不足为奇了。非常感谢您的回复,我对编程非常陌生。我正在使用导入的扩展来生成此导入。我很想另存为.docx,但我认为它不受支持。如何修改文件数据以导入图像?使用.doc比使用较新格式的.docx稍微困难一些。考虑向无关联的Leffice倾倒HTML和从相关文件夹中拾取文件。考虑链接类似的参考文献