Php 如何从html源代码中获取一些元素并将它们转换为可读文本?

Php 如何从html源代码中获取一些元素并将它们转换为可读文本?,php,Php,我有一个页面显示ASCII格式的“HeLLo 54292”,在标记中使用+字符生成正楷。我用PHP生成这个,并了解ASCII艺术是如何构建的 我想将ASCII艺术字母转换为实际文本,这样我就可以解析HTML源代码,最后得到字符串“HeLLo 54292”。如何实现这一点?步骤1:用PHP编写HTML呈现引擎。它将解析HTML,布局页面并将其呈现为图像 步骤2:用PHP编写一个光学字符识别库。它将图像作为输入,并通过形状识别图像中的字母 第3步:组合这些程序,您可以将表格转换回文本 完整解决方案的

我有一个页面显示ASCII格式的“HeLLo 54292”,在
标记中使用
+
字符生成正楷。我用PHP生成这个,并了解ASCII艺术是如何构建的


我想将ASCII艺术字母转换为实际文本,这样我就可以解析HTML源代码,最后得到字符串“HeLLo 54292”。如何实现这一点?

步骤1:用PHP编写HTML呈现引擎。它将解析HTML,布局页面并将其呈现为图像

步骤2:用PHP编写一个光学字符识别库。它将图像作为输入,并通过形状识别图像中的字母

第3步:组合这些程序,您可以将表格转换回文本


完整解决方案的预计时间:1-2年。

哇,我会选择“不可能”。为什么需要将其转换为文本?你们有这样一个生成文本的程序吗?如果是这样,是什么阻止您获取原始变量???

使用与生成HTML相同的模式来解构HTML。

您使用PHP从字符串创建HTML。反向将HTML转换回字符串的过程。你有源代码,应该很容易


对表示像素的每个字符串进行反向替换,然后重新创建图案。然后将该模式与您从每个角色生成的模式进行比较,以找到序列。

我投票认为这不是一个真正的问题。但是,如果这不是一个真正的问题,我会尝试提供一个真正的答案

我的建议是,假设字符并不总是相同的,并且您的目标是将任何ASCII艺术文本转换为字符串表示,将页面呈现为图像,并尝试使用某种[OCR程序]9http://en.wikipedia.org/wiki/Optical_character_recognition)试图识别字符并确定原始文本是什么


当然,如果ASCII art总是使用相同的字符,您可以使用正则表达式或其他字符串操作来解析它。

我相信您可以将其打包为Mechanical Turk上的任务。这完全符合通过浏览器渲染解决问题的模式

延迟会很好,可能只是比堆栈溢出快一点


事实上,好吧,如果你把它和。。不,说真的,你们这些读到这篇文章的人,你们宁愿得到三便士,还是10分?嗯?

对此没有直接的答案。这太复杂了,我不得不质疑你为什么要这么做。为什么要用表格生成文本图像,为什么要尝试将这些表格转换为文本?我不理解这个问题,但我喜欢这个网页。:)@david van brink,lol:)谢谢,mate.ascii艺术在十年前很可爱,但现在仍然很可爱???这是一个评论,不是吗?我是用PHP制作的。我的php页面生成“图像文本”(或其他任何内容)。然而,我想把它再次转换成文本。这不是不可能的,只是很难。为什么要把它转换回来呢?您已经有了图像文本。只需将它保存在一个会话中,并使用我用PHP创建的会话即可。我已经亲手编写了PHP源代码。你的目标是什么?妈的,你刚刚赢了我!您可以找到同时执行这两项操作的库。我打赌你不到一个星期就能做完。