Flash 计算x&;y坐标,PDF文档中特定文本段的宽度和高度

Flash 计算x&;y坐标,PDF文档中特定文本段的宽度和高度,flash,pdf,accessibility,Flash,Pdf,Accessibility,在我的网站上,我在flash播放器中显示上传的PDF文件,供我的用户阅读 我已经使用各种工具来提取文本,并从文件中生成一系列高质量的图像,系统运行良好 最后一个难题是能够突出显示文档的特定部分,以帮助用户解决可访问性问题 但是,我不知道如何计算特定文本在页面上的位置 注: 上载到系统的文档来自第三方,因此可能会嵌入字体。这意味着我不能确定特定字母的宽度 要突出显示的文本可能不是唯一的,相同的文本可能会重复 如何计算PDF上特定文本的坐标、高度和宽度,以便在其周围绘制一个框?我在最近的一个项目

在我的网站上,我在flash播放器中显示上传的PDF文件,供我的用户阅读

我已经使用各种工具来提取文本,并从文件中生成一系列高质量的图像,系统运行良好

最后一个难题是能够突出显示文档的特定部分,以帮助用户解决可访问性问题

但是,我不知道如何计算特定文本在页面上的位置

注:

  • 上载到系统的文档来自第三方,因此可能会嵌入字体。这意味着我不能确定特定字母的宽度
  • 要突出显示的文本可能不是唯一的,相同的文本可能会重复

如何计算PDF上特定文本的坐标、高度和宽度,以便在其周围绘制一个框?

我在最近的一个项目中使用了一个名为QuickPDF的SDK,该SDK来自www.QuickPDF.com

它们有一个名为ExtractFilePageText()的函数,可以返回文本、字体、边界框坐标

提取选项包括:-

0=以人类可读的格式提取文本 2=返回一个CSV字符串,其中包括每一个字符的字体、颜色、大小和位置 页面上的文本 使用更精确的文本提取算法: 3=为页面上的每段文本返回CSV字符串,并包含以下内容 格式: 字体名称、文本颜色、文本大小、X1、Y1、X2、Y2、X3、Y3、X4、Y4、文本 坐标是文本的四个边界点,以点(1/72)为单位测量 英寸),以页面左下角为原点 4=与选项3类似,但返回单个单词,进行搜索 语言更简单


需要开发人员许可证,但不需要运行时版税。它还有许多其他有用的特性,可以与多种语言一起使用。这也很好。

我在最近的一个项目中使用了www.QuickPDF.com上名为QuickPDF的SDK

它们有一个名为ExtractFilePageText()的函数,可以返回文本、字体、边界框坐标

提取选项包括:-

0=以人类可读的格式提取文本 2=返回一个CSV字符串,其中包括每一个字符的字体、颜色、大小和位置 页面上的文本 使用更精确的文本提取算法: 3=为页面上的每段文本返回CSV字符串,并包含以下内容 格式: 字体名称、文本颜色、文本大小、X1、Y1、X2、Y2、X3、Y3、X4、Y4、文本 坐标是文本的四个边界点,以点(1/72)为单位测量 英寸),以页面左下角为原点 4=与选项3类似,但返回单个单词,进行搜索 语言更简单


需要开发人员许可证,但不需要运行时版税。它还有许多其他有用的特性,可以与多种语言一起使用。天气也很好。

看起来不错。谢谢你,安德鲁。看起来很棒。谢谢安德鲁。