Javascript 从html文本中获取数字,但它们显示为正方形
我下载了一个PDF,并用pdf2htmlEX将其转换为html文件 现在HTML文件显示在一个iframe中,它正确地显示了所有的数字,但是当我尝试使用jquery text()或类似工具获取纯文本时,它只会 正如js中的字符串一样,浏览器(safari和chrome)控制台也会显示 . 因此,我尝试进入原始HTML文件,该文件也显示 在vs代码或崇高中 然后我认为问题在于编码的代码使html以纯文本的形式可读,所以我在终端上尝试了nano,它也显示了 . 这就是我所展示的Javascript 从html文本中获取数字,但它们显示为正方形,javascript,html,css,Javascript,Html,Css,我下载了一个PDF,并用pdf2htmlEX将其转换为html文件 现在HTML文件显示在一个iframe中,它正确地显示了所有的数字,但是当我尝试使用jquery text()或类似工具获取纯文本时,它只会 正如js中的字符串一样,浏览器(safari和chrome)控制台也会显示 . 因此,我尝试进入原始HTML文件,该文件也显示 在vs代码或崇高中 然后我认为问题在于编码的代码使html以纯文本的形式可读,所以我在终端上尝试了nano,它也显示了 . 这就是我所展示的 &
<span class="fc0"></span>
但是浏览器似乎没有显示问题
代码>
作为“23”
如果我尝试css span display:none,数字就会消失,因此它们必须在那里,浏览器可以读取显示它们的数据
代码在图片中
非常感谢
本尼
您正在使用一个字体系列,该系列将正常拉丁语范围之外的字符映射为拉丁数字。/usr/local/bin/pdf2htmlEX--no drm 1--tounicode 1工作,因此您可以获得数字的unicode,但有时字体不是100% 什么是字体系列?@font-face{font-family:ff7;src:url('data:application/font-woff;base64,d09grgabaaaabg8aa0aaaa………..mbbrqmbnti6zjroos46zjroos46zjroos46zjgvmqa/b9pzp/wAfAU1Y')格式(“woff”);}.ff7{字体系列:ff7;线条高度:1.000000;字体样式:正常;字体重量:正常;可见性:可见;}