Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/vba/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Vba 为AI培训创建带有相应标签的文档变体_Vba_Machine Learning_Ms Word - Fatal编程技术网

Vba 为AI培训创建带有相应标签的文档变体

Vba 为AI培训创建带有相应标签的文档变体,vba,machine-learning,ms-word,Vba,Machine Learning,Ms Word,我正在寻找以下问题的简单解决方案: 我必须创建文档的变体并将其导出为图像。这可以通过MS Word邮件合并轻松完成,但我需要文档中每个文本块的像素位置。图像以及像素位置被输入用于AI训练 目前,我可以想到几种方法: 将MS Word邮件合并输出放入OCR,并通过与原始文本源进行比较,尝试识别文本块的位置 使用JS、Python或Visual Basic之类的工具创建文档,并在插入时保存每个插入文本块的确切位置 可以使用Visual Basic for Word从使用邮件合并功能创建的MS Wor

我正在寻找以下问题的简单解决方案: 我必须创建文档的变体并将其导出为图像。这可以通过MS Word邮件合并轻松完成,但我需要文档中每个文本块的像素位置。图像以及像素位置被输入用于AI训练

目前,我可以想到几种方法:

  • 将MS Word邮件合并输出放入OCR,并通过与原始文本源进行比较,尝试识别文本块的位置
  • 使用JS、Python或Visual Basic之类的工具创建文档,并在插入时保存每个插入文本块的确切位置
  • 可以使用Visual Basic for Word从使用邮件合并功能创建的MS Word XML文件中提取文本位置
  • 变体1似乎过于复杂,因为它使用了某种逆向工程。此外,即使在完全可读的文档上使用OCR也可能是错误的来源

    所以变体2或3看起来不错,但我不知道有任何库符合要求,而VisualBasicforWord对我来说是一个全新的领域

    我希望我对这个问题描述得足够好。如果你想让我澄清一些事情,请让我知道

    我感谢每一个想法和帮助!:)

    致意
    亨里克似乎已经有人不喜欢我的帖子了。在投票否决我之前,请让我知道如何改进

    无论如何,我可能已经找到了实现变体2的方法。这引用了扩展Python映像库的。它提供了在图像上写入文本的功能,还可以设置文本框的最大宽度。该函数还返回所绘制文本框的最终宽度和高度。使用这个,我将尝试实现一个创建文档图像和标签文件的算法

    也许这也会帮助其他人寻找同样的东西