Python 爬网和合并不同的站点

Python 爬网和合并不同的站点,python,information-retrieval,web-crawler,Python,Information Retrieval,Web Crawler,我正在抓取来自不同站点的数据,并希望跨站点合并数据。不同站点的数据格式不同。有没有一种通用的方法可以做到这一点,比如,不手动调查和纠正它 我确信第一次尝试是做不到的。假设我手动修复一些东西,有吗 在我的代码中开发人工智能的一种方法,它能处理未来的案例吗 +-----------------------------------------+ |2.0MP| |空的| |5.0MP| |8.0MP| |1.3MP| |3.2MP| |5.0MP;1.3MP正面| |8.0MP;1.3MP正面| |3

我正在抓取来自不同站点的数据,并希望跨站点合并数据。不同站点的数据格式不同。有没有一种通用的方法可以做到这一点,比如,不手动调查和纠正它

我确信第一次尝试是做不到的。假设我手动修复一些东西,有吗 在我的代码中开发人工智能的一种方法,它能处理未来的案例吗

+-----------------------------------------+
|2.0MP|
|空的|
|5.0MP|
|8.0MP|
|1.3MP|
|3.2MP|
|5.0MP;1.3MP正面|
|8.0MP;1.3MP正面|
|3.0MP|
| 2.0                                     |
|2.0-8.0MP|
| 1.3                                     |
|5.0MP(后向)|
|640 x 480 VGA|
|5.1MP|
|对|
|2.0 MP|
|3.2 MP|
|0.3MP|
|8.0MP;1.3MP|
|5.0MP;VGA正面|
|高达8.0MP|
|5.0MP后向;2.0MP前向|
|VGA|
| 5.0                                     |
|5.0MP后部;1.3MP前端|
|0.6MP|
|8.0MP,VGA正面|
|初级:5.0MP;中学:1.3MP|
|前1.3MP,后8.0MP|
|8.1MP|
|1680 x 480|
|5.0 MP|
|5.0MP后向;1.3MP正面|
| 3.0                                     |
|5.0MP;VGA|
|3.2MP:后向;0.3MP:正面|
|3.1MP|
+-----------------------------------------+

您发布的数据没有多大帮助。它代表什么?我猜是手机的规格。数据应该如何组织?您手动执行的是什么过程,希望自动执行?您能解释一下,示例中是什么吗?您需要添加一些代码……请告诉我们想要的输出是什么。