Php 从站点提取数据并放入文件

Php 从站点提取数据并放入文件,php,Php,在这个项目中,客户丢失了他们的数据库,因此我必须查找他们当前的(实时)站点并检索信息。。。问题是有太多的数据需要复制并插入到数据库中,这需要花费很多时间……您能推荐一些代码来帮助我吗?如果页面的结构都非常相似,您可以尝试使用正则表达式或html解析器(TIY)过滤出相关数据 我为一位客户做了类似的事情,他有200多个手写产品页面,上面有图像、标题和文本。源代码似乎是从上一页复制粘贴的,并且已经演变成了几种不同的风格。经过一些调整后,它工作得非常好。您可以使用DOMDocument library

在这个项目中,客户丢失了他们的数据库,因此我必须查找他们当前的(实时)站点并检索信息。。。问题是有太多的数据需要复制并插入到数据库中,这需要花费很多时间……您能推荐一些代码来帮助我吗?

如果页面的结构都非常相似,您可以尝试使用正则表达式或html解析器(TIY)过滤出相关数据


我为一位客户做了类似的事情,他有200多个手写产品页面,上面有图像、标题和文本。源代码似乎是从上一页复制粘贴的,并且已经演变成了几种不同的风格。经过一些调整后,它工作得非常好。

您可以使用DOMDocument library for php,在使用标记识别页面中的信息位置后,编写自动脚本来检索数据。

该库非常健壮,使用XPath。

定义“数据”。检索完整的HTML代码将很容易。只检索相关的部分可能会很困难。如果他们没有数据库,驱动他们的现场站点的是什么?戴维:可能是从数据库生成的静态文件。你的客户是否考虑购买数据恢复?