Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/image/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 不安全图像的图像适配_Php_Image_Filter_Detection - Fatal编程技术网

Php 不安全图像的图像适配

Php 不安全图像的图像适配,php,image,filter,detection,Php,Image,Filter,Detection,现在,我有一个网站可以抓取图像。这些图像是根据他们的偏好提供的,即是否允许使用不安全的(18+)图像 现在我们自己整理图片,因为每天都有很多图片提交,这需要很长时间 我知道谷歌做得很好 我只是想把性和色情的图片整理一下。穿比基尼的女孩很好 我有一个想法,在那里程序将搜索图像的模式的图像,我不想被显示。例如,在图像中搜索私密处,如果发现图案,则将其标记为不安全 我想知道php中是否有任何程序或算法可用于为我们执行此操作?我假设您希望根据图像内容而不是上下文(例如,图像周围有哪些单词)进行过滤 这是

现在,我有一个网站可以抓取图像。这些图像是根据他们的偏好提供的,即是否允许使用不安全的(18+)图像

现在我们自己整理图片,因为每天都有很多图片提交,这需要很长时间

我知道谷歌做得很好

我只是想把性和色情的图片整理一下。穿比基尼的女孩很好

我有一个想法,在那里程序将搜索图像的模式的图像,我不想被显示。例如,在图像中搜索私密处,如果发现图案,则将其标记为不安全


我想知道php中是否有任何程序或算法可用于为我们执行此操作?

我假设您希望根据图像内容而不是上下文(例如,图像周围有哪些单词)进行过滤


这是相当激烈的人工智能。你需要训练一个算法,这样它才能“了解”一个不安全的图像是什么样子。这是一篇关于这个主题的优秀论文:

尽管SimpleCoder的解决方案远比这复杂,但我仍然建议手动调整图像。除非你花费数千美元来制作一些非常先进的算法,否则你总是会有误报和漏报。作为一个小实验,我去上传了8张图片。6例清洁,2例明确。在两张清晰的图片中,有一张被错误地标记为干净。在六张干净的图片中,有四张被错误地标记为清晰。请注意,我故意试图通过选择我认为计算机会混淆的图像来愚弄它,结果证明这很容易。他们的计划只得到了微不足道的37.5%

以下是一些建议,这些建议至少会让主持人的生活变得更轻松,并且不会太难通过编程实现:

1) 获取所有当前被拒绝的图像(如果可能的话),对文件进行散列,并将散列存储在数据库中。对所有新提交的内容进行散列,并根据现有散列验证散列。如果找到匹配项,则自动标记它。当管理员手动拒绝图像时,也将此哈希添加到数据库中。这至少可以防止您重新标记重复项

2) 如果在整个域的任何文件中发现任何显式内容,请将$ISPornCore的权重添加到该域中的所有图像。也许应该为来自一个域的多个事件赋予更多的权重。执行与域热链接到这些域上的图像类似的操作

3) 检查域名本身。如果它包含显式语言,请添加到$ISPornCore。同样,应该对图像和包含锚定标记的页面的URI执行相同的操作(如果不同)

4) 检查图像周围的文本。即使这不是100%准确,如果你在一个页面的某个地方有一个公然的“三个女人和…的农场sexxx”,你至少可以增加该页面(或域)上所有图像的权重


5) 使用您可以使用的任何其他技术或标准,并对图像应用总体“分数”。然后使用您自己的判断和/或尝试和错误,如果分数高于某个数值,则自动将其标记为明确并标记。尝试在误报和不标记显式图像的成本之间达到可接受的平衡。如果它没有自动标记为显式,仍然需要主持人干预。

即使在人类中,应该过滤为“不安全”的内容也是相当主观的。我想一个程序可以在简单的情况下识别出“不安全”的图像,但可能会有更多的图像漏掉,也可能有很多误报。这是一个重复的。没有简单的解决方案。我将首先对已经标记的图像进行数据分析,并尝试与这些图像进行模式匹配。颜色选择范围,平均颜色模式等。当然,没问题。我还通过此搜索获得了一系列结果: