C# 从PDF/Word文件中提取内容代码

C# 从PDF/Word文件中提取内容代码,c#,pdf,ms-word,pdf-manipulation,C#,Pdf,Ms Word,Pdf Manipulation,我必须使用MS Word和PDF的大文件,其中包含图像、文本字段和表格 我需要在这些文件中的特定位置动态插入文本。我在Word中尝试了书签方法,但现在无法使用该方法。我已将数据提取到字节数组中,并尝试以pdf格式写入,但文件已损坏。代码如下: byte[]bytes=System.IO.File.ReadAllBytes(“CDC.doc”); FileStream fs=newfilestream(“CDC.pdf”,FileMode.OpenOrCreate); fs.Write(字节,0

我必须使用MS Word和PDF的大文件,其中包含图像、文本字段和表格

我需要在这些文件中的特定位置动态插入文本。我在Word中尝试了书签方法,但现在无法使用该方法。我已将数据提取到字节数组中,并尝试以pdf格式写入,但文件已损坏。代码如下:

byte[]bytes=System.IO.File.ReadAllBytes(“CDC.doc”);
FileStream fs=newfilestream(“CDC.pdf”,FileMode.OpenOrCreate);
fs.Write(字节,0,字节.长度);

fs.Close()如果我理解正确,您希望开发一个代码,用您的应用程序数据替换Word文档中作为模板的所有占位符。对于占位符,您可以使用书签,但更好的选择是内容控件。您可以使用OpenXMLSDK解析这样的模板Word文档,并用数据替换内容控件。这种方法使用免费的MS库,但很乏味


一个更简单的方法是使用一个现成的库,它可以与模板一起工作,模板中包含的占位符将在运行时被实际应用程序数据替换。在C#应用程序中,您可以准备数据(作为C#数据对象或XML)并将这些数据与模板合并。输出可以是docx、pdf或xps格式。您可以查看一些。

在这里查看一下,谢谢,但我不能使用Microsoft.Interop.OfficeNo之类的MS库,这是可能的。我尝试过一些其他的解决方案,但这些都是无效的。所以请。不要反对!