Python 链接删除系统的安全风险

Python 链接删除系统的安全风险,python,security,http,Python,Security,Http,我正在实现一个链接抓取系统,比如Facebook的链接共享功能,用户输入一个url,通过ajax传递给我们的服务器,然后我们的服务器执行一个get请求(使用库)并解析响应html以捕获页面的相关信息 在这种类型的系统中,显然一个人可以输入他们想要的任何url。我试图想象在这种情况下,我们的服务器可能会面临什么类型的安全风险?这样的设置会被恶意利用吗 您可能希望确保服务器不执行任何插件或复制任何视频/图像 Javascript更为棘手,如果您忽略它,您将丢失一些链接,如果您执行它,那么您最好确保您

我正在实现一个链接抓取系统,比如Facebook的链接共享功能,用户输入一个url,通过ajax传递给我们的服务器,然后我们的服务器执行一个get请求(使用库)并解析响应html以捕获页面的相关信息


在这种类型的系统中,显然一个人可以输入他们想要的任何url。我试图想象在这种情况下,我们的服务器可能会面临什么类型的安全风险?这样的设置会被恶意利用吗

您可能希望确保服务器不执行任何插件或复制任何视频/图像

Javascript更为棘手,如果您忽略它,您将丢失一些链接,如果您执行它,那么您最好确保您没有被用于发送垃圾邮件之类的操作


如果你这么问,你可能还不够肯定

您可能希望确保服务器不执行任何插件或复制任何视频/图像

Javascript更为棘手,如果您忽略它,您将丢失一些链接,如果您执行它,那么您最好确保您没有被用于发送垃圾邮件之类的操作


如果你这么问,你可能还不够肯定

您应该对(远程/本地)文件包含漏洞和攻击进行谷歌搜索。如果您没有受到这两种攻击,那么您就很好。

您应该在google on(远程/本地)上进行文件包含漏洞和攻击。如果您不受这两种攻击,那么您就很好。

我已经构建了许多小型和大型爬网系统。实际上,我不知道你在说什么样的安全风险。我不清楚你的要求

但是,如果您所做的只是使用BeautifulSoup获取html,然后提取页面的某些内容,如
标题
标记&
元数据
标记信息等,然后存储这些数据。我看不出有什么问题


除非你不是盲目地对url的响应或用户输入的内容进行某种
评估,否则我觉得你是安全的。

我已经建立了很多小型和大型爬行系统。实际上,我不知道你在说什么样的安全风险。我不清楚你的要求

但是,如果您所做的只是使用BeautifulSoup获取html,然后提取页面的某些内容,如
标题
标记&
元数据
标记信息等,然后存储这些数据。我看不出有什么问题


除非您不是盲目地对url的响应或用户输入的内容进行某种
eval
,否则我觉得您是安全的。

由于涉及的风险,您最好不要尝试执行任何JavaScript。由于涉及的风险,您最好不要尝试执行任何JavaScript。