用DOM处理格式不正确的HTML

用DOM处理格式不正确的HTML,dom,data-mining,Dom,Data Mining,我有一个HTML,它是从一个网站的源代码获得的。我用post方法将数据从我的页面发送到网站,响应是源代码。我需要一些源代码中的文本 文件格式不正确。所以,我不能使用DOM,也不能用DOM分离标记和数据。 如何分离标记和数据,以及如何获取唯一的数据 我正在使用PHP 谢谢。我发现了一些关于从html源代码获取数据的信息。我有疑问地说,我在使用PHP。 我将使用preg_match_all函数和正则表达式。希望我能克服;) 向所有感兴趣的人发送Thx;) 可能的重复也可以在后面看到我添加的,我使用的

我有一个HTML,它是从一个网站的源代码获得的。我用post方法将数据从我的页面发送到网站,响应是源代码。我需要一些源代码中的文本

文件格式不正确。所以,我不能使用DOM,也不能用DOM分离标记和数据。 如何分离标记和数据,以及如何获取唯一的数据

我正在使用PHP


谢谢。

我发现了一些关于从html源代码获取数据的信息。我有疑问地说,我在使用PHP。 我将使用preg_match_all函数和正则表达式。希望我能克服;)


向所有感兴趣的人发送Thx;)

可能的重复也可以在后面看到我添加的,我使用的是PHP。