从PDF中提取文本并保存到数据库-保留间距

从PDF中提取文本并保存到数据库-保留间距,pdf,text,crystal-reports,formatting,fonts,Pdf,Text,Crystal Reports,Formatting,Fonts,我有一个PDF文档,其中只包含需要保存到MSSQL中的varchar列中的文本。第一个问题是PDF中文本的间距也需要保留,这不能简单地通过将PDF复制粘贴到SSM中来实现 好的,我需要一个应用程序来读取PDF作为文本,同时保留间距。但现在第二个问题出现了:PDF以Helvetica字体呈现,但保存到DB中的文本将以Arial格式显示在Crystal Report Crystal 8上。。。bleh,当显示时,它需要看起来像PDF,即尽可能保持相同的对齐方式 我提出的解决方案是将PDF转换为矢量图

我有一个PDF文档,其中只包含需要保存到MSSQL中的varchar列中的文本。第一个问题是PDF中文本的间距也需要保留,这不能简单地通过将PDF复制粘贴到SSM中来实现

好的,我需要一个应用程序来读取PDF作为文本,同时保留间距。但现在第二个问题出现了:PDF以Helvetica字体呈现,但保存到DB中的文本将以Arial格式显示在Crystal Report Crystal 8上。。。bleh,当显示时,它需要看起来像PDF,即尽可能保持相同的对齐方式

我提出的解决方案是将PDF转换为矢量图像,将生成的字节流保存到DB中,然后通过Crystal将字节拉入。不幸的是,由于时间限制,现在无法实现,所以我需要一个快速而肮脏的解决方案


基本上,一旦我从PDF中获得Helvetica版本,我就必须修改间距,以使其在Arial中看起来正确。我需要一个能帮我做到这一点的工具,因为我没有时间写一个-有什么建议吗?

你的Crystal版本能处理动态图像位置吗?如果是这样的话,你可以保存一张PDF的图像。我相信在你的Crystal Report中有一个实用程序,可以创建一个图像对象,图像位置设置为你想要的任何PDF格式。

恐怕这是一个用户教育问题:Arial字体的输出与Helvetica字体的输出间隔不同。这需要向用户解释

提到拉瑟盖特——可能有助于说服他们;本质上,丹·拉瑟的职业生涯结束了,因为他不理解不同字体中字符间距的重要性/过度简化


另一种方法可能是使用字体编辑器,保存一个具有Helvetica间距属性的Arial字体版本,然后在报告中使用此新字体-这真是一个难题,看起来很糟糕,很可能会侵犯该字体的版权,可能是微软拥有的。我真的不推荐它。

我不得不问:既然你要做的就是把你的水晶格式改成Helvetica,为什么还要这么长?最终用户是否坚持某种字体?啊。你的问题在于最终用户。你需要更好的最终用户。问题解决了:幸运的是,我没有选择用户、环境,也没有选择Crystal中的报告。