Python 实现“添加到篮子”按钮分类器
我有一个问题,我对攻击它感到困惑。 这就是任务: 我们希望您在提供的数据集上实现“添加到篮子”按钮分类器。具体来说,我们希望分类器识别正确的“addtobasket”按钮的id属性 它已经提供给我一个1000个网站的数据集 每个网站有两个文件: 1HTML文件-每个文件都是电子商务产品页面的DOM表示 2JSON文件-每个HTML文件的元数据。“button_id”键通过HTML标记属性“id”指示每个相关HTML文件上正确的“add to basket”按钮的位置 我不认为HTLM文件和产品页面在此任务中提供了任何帮助。 这是一个标准的产品页面,包含许多其他不相关的信息,如联系人、地址、语言等 JSON文件如下所示Python 实现“添加到篮子”按钮分类器,python,html,json,deep-learning,classification,Python,Html,Json,Deep Learning,Classification,我有一个问题,我对攻击它感到困惑。 这就是任务: 我们希望您在提供的数据集上实现“添加到篮子”按钮分类器。具体来说,我们希望分类器识别正确的“addtobasket”按钮的id属性 它已经提供给我一个1000个网站的数据集 每个网站有两个文件: 1HTML文件-每个文件都是电子商务产品页面的DOM表示 2JSON文件-每个HTML文件的元数据。“button_id”键通过HTML标记属性“id”指示每个相关HTML文件上正确的“add to basket”按钮的位置 我不认为HTLM文件和产品页
actions
0 "click"
augmented_tags []
button_ids
0 "0±±ui-id-1883"
context null
extended_url "https://www.neimanmarcus.com/en-gb/p/loro-piana-andre-denim-sport-shirt-prod200810299?ecid=NMAF__ShopStyle++Collective&CS_003=5630585&utm_medium=affiliate&utm_source=NMAF__ShopStyle++Collective"
features {}
html_filename "ex8560step01.large.html"
placeholders
0 null
skip_augmentation true
step 1
我需要分类哪一个是一个好的做法添加篮按钮和那些不是
我的想法是让算法打开网页,然后可视化页面本身,然后与我可以使用标签的最佳实践页面进行比较
如果我想变得更复杂的话,这将是CNN分类或ResNet
我不认为这是NLP的事
我错了?
有什么想法吗?
如果是这样的话,我是如何让CNN关注“添加晒太阳”按钮的位置的
我被要求用神经网络来做这件事
谢谢如果你有很多好按钮和坏按钮的例子,你可以用CNN来做这件事 我将使用selenium加载页面,定位元素,获取元素的尺寸,拍摄页面的屏幕截图,然后根据图像位置和尺寸裁剪屏幕截图 把它输入你的分类器
不过,我怀疑您所寻找的内容与底层代码的关系与按钮的视觉表示一样,在这一点上,我不确定图像分类是否有意义。请记住,在执行代码块时“不是”谢谢。我当时有一个意大利键盘,但没有,但我的错是使用不当。我没有正确表达我需要说什么是正确的添加篮按钮。正确的那个。我需要CNN关注AddBasket按钮,因为它位于正确的位置或最佳实践位置,在不同的网页上有所不同。我想将数据集之外的网页标记为良好实践,然后将其与数据集中的网页进行比较