Python 实现“添加到篮子”按钮分类器

Python 实现“添加到篮子”按钮分类器,python,html,json,deep-learning,classification,Python,Html,Json,Deep Learning,Classification,我有一个问题,我对攻击它感到困惑。 这就是任务: 我们希望您在提供的数据集上实现“添加到篮子”按钮分类器。具体来说,我们希望分类器识别正确的“addtobasket”按钮的id属性 它已经提供给我一个1000个网站的数据集 每个网站有两个文件: 1HTML文件-每个文件都是电子商务产品页面的DOM表示 2JSON文件-每个HTML文件的元数据。“button_id”键通过HTML标记属性“id”指示每个相关HTML文件上正确的“add to basket”按钮的位置 我不认为HTLM文件和产品页

我有一个问题,我对攻击它感到困惑。 这就是任务:

我们希望您在提供的数据集上实现“添加到篮子”按钮分类器。具体来说,我们希望分类器识别正确的“addtobasket”按钮的id属性

它已经提供给我一个1000个网站的数据集 每个网站有两个文件: 1HTML文件-每个文件都是电子商务产品页面的DOM表示 2JSON文件-每个HTML文件的元数据。“button_id”键通过HTML标记属性“id”指示每个相关HTML文件上正确的“add to basket”按钮的位置

我不认为HTLM文件和产品页面在此任务中提供了任何帮助。 这是一个标准的产品页面,包含许多其他不相关的信息,如联系人、地址、语言等

JSON文件如下所示


actions
     0  "click"
augmented_tags  []

button_ids
     0    "0±±ui-id-1883"

context null

extended_url    "https://www.neimanmarcus.com/en-gb/p/loro-piana-andre-denim-sport-shirt-prod200810299?ecid=NMAF__ShopStyle++Collective&CS_003=5630585&utm_medium=affiliate&utm_source=NMAF__ShopStyle++Collective"

features    {}

html_filename   "ex8560step01.large.html"
placeholders    

     0      null

skip_augmentation   true

step    1  
我需要分类哪一个是一个好的做法添加篮按钮和那些不是

我的想法是让算法打开网页,然后可视化页面本身,然后与我可以使用标签的最佳实践页面进行比较 如果我想变得更复杂的话,这将是CNN分类或ResNet 我不认为这是NLP的事

我错了? 有什么想法吗? 如果是这样的话,我是如何让CNN关注“添加晒太阳”按钮的位置的

我被要求用神经网络来做这件事


谢谢

如果你有很多好按钮和坏按钮的例子,你可以用CNN来做这件事

我将使用selenium加载页面,定位元素,获取元素的尺寸,拍摄页面的屏幕截图,然后根据图像位置和尺寸裁剪屏幕截图

把它输入你的分类器


不过,我怀疑您所寻找的内容与底层代码的关系与按钮的视觉表示一样,在这一点上,我不确定图像分类是否有意义。

请记住,在执行代码块时“不是”谢谢。我当时有一个意大利键盘,但没有,但我的错是使用不当。我没有正确表达我需要说什么是正确的添加篮按钮。正确的那个。我需要CNN关注AddBasket按钮,因为它位于正确的位置或最佳实践位置,在不同的网页上有所不同。我想将数据集之外的网页标记为良好实践,然后将其与数据集中的网页进行比较