iOS如何获取PDF页面中的所有单词坐标

iOS如何获取PDF页面中的所有单词坐标,ios,pdf,nsscanner,cgpdfdocument,cgpdfscanner,Ios,Pdf,Nsscanner,Cgpdfdocument,Cgpdfscanner,我已经阅读了很多教程,通常是堆叠用户到pdfkitten的链接,但在我测试它时,我对结果并不满意。因此,搜索不适用于乘法单词等 因此,我需要从pdf页面中获取所有单词,并在单词穿过某个矩形时高亮显示。我使用PDFKitten进行了相同的操作 我所做的是在扫描PDF文件时,识别分开的单词 按空格 保存渲染状态(PDFKitten代码中的模型)word为 在模型中使用该词的当前名称保存该词时遇到问题 RenderingState(PDFKitten代码中的模型),它将是初始状态。 当找到完整的单词

我已经阅读了很多教程,通常是堆叠用户到pdfkitten的链接,但在我测试它时,我对结果并不满意。因此,搜索不适用于乘法单词等


因此,我需要从pdf页面中获取所有单词,并在单词穿过某个矩形时高亮显示。

我使用PDFKitten进行了相同的操作

  • 我所做的是在扫描PDF文件时,识别分开的单词 按空格
  • 保存渲染状态(PDFKitten代码中的模型)word为 在模型中使用该词的当前名称保存该词时遇到问题 RenderingState(PDFKitten代码中的模型),它将是初始状态。 当找到完整的单词(空格分隔)时,再次保存 当前渲染状态作为最终状态
  • 使用将渲染状态转换为实际视图帧的代码 上述初始状态和最终状态均存在于PDFKitten中。你可以 请参阅该代码
  • 将当前媒体框变换应用于帧
  • 最后别忘了 将生成的框架转换为用户的坐标系。否则 你将观察到相反的效果

但是,PDFKitten的CMap解析存在问题。它丢弃了许多映射。您可能希望首先修复该问题,以便获得正确的字符映射。您好,Swaroop,您可以共享您在此处解释的代码吗?不幸的是,不可以。这是一个商业应用程序,因此无法共享代码。您能找到解决方案吗?如果是,请将其添加为答案,以便对您有所帮助。谢谢