Vba 为AI培训创建带有相应标签的文档变体_Vba_Machine Learning_Ms Word

Vba 为AI培训创建带有相应标签的文档变体

vba machine-learning ms-word

Vba 为AI培训创建带有相应标签的文档变体,vba,machine-learning,ms-word,Vba,Machine Learning,Ms Word,我正在寻找以下问题的简单解决方案：我必须创建文档的变体并将其导出为图像。这可以通过MS Word邮件合并轻松完成，但我需要文档中每个文本块的像素位置。图像以及像素位置被输入用于AI训练目前，我可以想到几种方法：将MS Word邮件合并输出放入OCR，并通过与原始文本源进行比较，尝试识别文本块的位置使用JS、Python或Visual Basic之类的工具创建文档，并在插入时保存每个插入文本块的确切位置可以使用Visual Basic for Word从使用邮件合并功能创建的MS Wor

我正在寻找以下问题的简单解决方案：我必须创建文档的变体并将其导出为图像。这可以通过MS Word邮件合并轻松完成，但我需要文档中每个文本块的像素位置。图像以及像素位置被输入用于AI训练

目前，我可以想到几种方法：

将MS Word邮件合并输出放入OCR，并通过与原始文本源进行比较，尝试识别文本块的位置

使用JS、Python或Visual Basic之类的工具创建文档，并在插入时保存每个插入文本块的确切位置

可以使用Visual Basic for Word从使用邮件合并功能创建的MS Word XML文件中提取文本位置

变体1似乎过于复杂，因为它使用了某种逆向工程。此外，即使在完全可读的文档上使用OCR也可能是错误的来源

所以变体2或3看起来不错，但我不知道有任何库符合要求，而VisualBasicforWord对我来说是一个全新的领域

我希望我对这个问题描述得足够好。如果你想让我澄清一些事情，请让我知道

我感谢每一个想法和帮助！：）

致意

亨里克似乎已经有人不喜欢我的帖子了。在投票否决我之前，请让我知道如何改进

无论如何，我可能已经找到了实现变体2的方法。这引用了扩展Python映像库的。它提供了在图像上写入文本的功能，还可以设置文本框的最大宽度。该函数还返回所绘制文本框的最终宽度和高度。使用这个，我将尝试实现一个创建文档图像和标签文件的算法

也许这也会帮助其他人寻找同样的东西