Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/83.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在PHP中将ASCII转换为纯文本_Php_Html_Ascii_Plaintext - Fatal编程技术网

在PHP中将ASCII转换为纯文本

在PHP中将ASCII转换为纯文本,php,html,ascii,plaintext,Php,Html,Ascii,Plaintext,我正在抓取一些网站,并有ASCII文本,我想转换为纯文本存储在数据库中。比如我想要 I have got to tell anyone who will listen that this is one of THE best adventure movies I've ever seen. It's almost impossible to convey how pumped I am now that I've seen it. 转化为

我正在抓取一些网站,并有ASCII文本,我想转换为纯文本存储在数据库中。比如我想要

I have got to tell anyone who will listen that this is
one of THE best adventure movies I've ever seen.
It's almost impossible to convey how pumped I am
now that I've seen it.
转化为

I have got to tell anyone who will listen that this is
one of THE best adventure movies I've ever seen. It's
almost impossible to convey how pumped I am now that
I've seen it.
我用谷歌搜索了我的手指,有什么帮助吗?

你可以使用:

几点注意:

  • 请注意,看起来您实际上想要从HTML编码的字符串(带有像
    ;
    这样的实体)转换为ASCII也称为明文

  • 此示例将所有ASCII字符转换为ASCII兼容字符编码(即字符代码低于128)。如果你真的想要纯ASCII码(这样就失去了所有重音字符和来自外语的字符),你应该分别去掉所有有问题的字符

  • 最后一个参数('UTF-8')是保持与不同PHP版本兼容所必需的,因为自PHP5.4.0以来,默认值已更改

更新:


更新2:根据@Daan的建议将ENT_COMPAT更改为ENT_QUOTES。

感谢您的输入。实际上,我已经尝试使用html#u entity#u decode,但我的输出仍然具有与引号相同的ASCII格式,例如&x27;这是HTML编码的吗?我确实想从HTML编码的字符串变成ASCII明文,因为我正在对结果进行情绪分析;您确定要将正确的参数传递给
html\u entity\u decode
?@Daan是的,它在浏览器中工作,但当我在CLI中运行相同的代码时,问题仍然存在。啊,当然。您将需要使用
ENT\u引号
而不是
ENT\u COMPAT
。不知道为什么这在ideone中正确工作。就是这样!提出一个答案,我会记下来。谢谢你的帮助。谢谢你的帮助,工作得很好!可能重复的,请参见右侧的相关问题。
echo html_entity_decode('...', ENT_QUOTES, 'UTF-8');