C# 从PDF/Word文件中提取内容代码_C#_Pdf_Ms Word_Pdf Manipulation

C# 从PDF/Word文件中提取内容代码

c# pdf ms-word

C# 从PDF/Word文件中提取内容代码,c#,pdf,ms-word,pdf-manipulation,C#,Pdf,Ms Word,Pdf Manipulation,我必须使用MS Word和PDF的大文件，其中包含图像、文本字段和表格我需要在这些文件中的特定位置动态插入文本。我在Word中尝试了书签方法，但现在无法使用该方法。我已将数据提取到字节数组中，并尝试以pdf格式写入，但文件已损坏。代码如下： byte[]bytes=System.IO.File.ReadAllBytes（“CDC.doc”）； FileStream fs=newfilestream（“CDC.pdf”，FileMode.OpenOrCreate）； fs.Write（字节，0

我必须使用MS Word和PDF的大文件，其中包含图像、文本字段和表格

我需要在这些文件中的特定位置动态插入文本。我在Word中尝试了书签方法，但现在无法使用该方法。我已将数据提取到字节数组中，并尝试以pdf格式写入，但文件已损坏。代码如下：

byte[]bytes=System.IO.File.ReadAllBytes（“CDC.doc”）；
FileStream fs=newfilestream（“CDC.pdf”，FileMode.OpenOrCreate）；
fs.Write（字节，0，字节.长度）；
fs.Close（）如果我理解正确，您希望开发一个代码，用您的应用程序数据替换Word文档中作为模板的所有占位符。对于占位符，您可以使用书签，但更好的选择是内容控件。您可以使用OpenXMLSDK解析这样的模板Word文档，并用数据替换内容控件。这种方法使用免费的MS库，但很乏味
一个更简单的方法是使用一个现成的库，它可以与模板一起工作，模板中包含的占位符将在运行时被实际应用程序数据替换。在C#应用程序中，您可以准备数据（作为C#数据对象或XML）并将这些数据与模板合并。输出可以是docx、pdf或xps格式。您可以查看一些。
在这里查看一下，谢谢，但我不能使用Microsoft.Interop.OfficeNo之类的MS库，这是可能的。我尝试过一些其他的解决方案，但这些都是无效的。所以请。不要反对！