Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/74.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 从html文本中获取数字,但它们显示为正方形_Javascript_Html_Css - Fatal编程技术网

Javascript 从html文本中获取数字,但它们显示为正方形

Javascript 从html文本中获取数字,但它们显示为正方形,javascript,html,css,Javascript,Html,Css,我下载了一个PDF,并用pdf2htmlEX将其转换为html文件 现在HTML文件显示在一个iframe中,它正确地显示了所有的数字,但是当我尝试使用jquery text()或类似工具获取纯文本时,它只会 正如js中的字符串一样,浏览器(safari和chrome)控制台也会显示 . 因此,我尝试进入原始HTML文件,该文件也显示 在vs代码或崇高中 然后我认为问题在于编码的代码使html以纯文本的形式可读,所以我在终端上尝试了nano,它也显示了 . 这就是我所展示的 &

我下载了一个PDF,并用pdf2htmlEX将其转换为html文件

现在HTML文件显示在一个iframe中,它正确地显示了所有的数字,但是当我尝试使用jquery text()或类似工具获取纯文本时,它只会 正如js中的字符串一样,浏览器(safari和chrome)控制台也会显示 .

因此,我尝试进入原始HTML文件,该文件也显示 在vs代码或崇高中

然后我认为问题在于编码的代码使html以纯文本的形式可读,所以我在终端上尝试了nano,它也显示了 .

这就是我所展示的

<span class="fc0"></span>

但是浏览器似乎没有显示问题



作为“23”

如果我尝试css span display:none,数字就会消失,因此它们必须在那里,浏览器可以读取显示它们的数据

代码在图片中

非常感谢

本尼


您正在使用一个字体系列,该系列将正常拉丁语范围之外的字符映射为拉丁数字。

/usr/local/bin/pdf2htmlEX--no drm 1--tounicode 1工作,因此您可以获得数字的unicode,但有时字体不是100%

什么是字体系列?@font-face{font-family:ff7;src:url('data:application/font-woff;base64,d09grgabaaaabg8aa0aaaa………..mbbrqmbnti6zjroos46zjroos46zjroos46zjgvmqa/b9pzp/wAfAU1Y')格式(“woff”);}.ff7{字体系列:ff7;线条高度:1.000000;字体样式:正常;字体重量:正常;可见性:可见;}