Passwords 如果有人在自己的公共Github存储库中复制了我的公司代码/重要数据,如何在所有Github公共回购中搜索

Passwords 如果有人在自己的公共Github存储库中复制了我的公司代码/重要数据,如何在所有Github公共回购中搜索,passwords,scanning,sensitive-data,Passwords,Scanning,Sensitive Data,我对GitHub代码和数据搜索之类的东西不熟悉。 我的动机是搜索/扫描GitHub/Git的A到Z公共存储库,以确保没有人复制了我公司的源代码或敏感数据 我正在思考以下挑战 如何在GitHub上获取a到Z公共存储库的列表 如何扫描我的数据,可能存在于数百万个存储库中 如果有办法用任何脚本或代码扫描Word目录 请给我一个指南 非常感谢您的快速帮助(提前!) 阿披实欢迎来到StackOverflow 您最好的选择是使用查找您感兴趣的代码。例如,使用Github对我的域名进行搜索(而不是通过API)

我对GitHub代码和数据搜索之类的东西不熟悉。 我的动机是搜索/扫描GitHub/Git的A到Z公共存储库,以确保没有人复制了我公司的源代码或敏感数据

我正在思考以下挑战

  • 如何在GitHub上获取a到Z公共存储库的列表
  • 如何扫描我的数据,可能存在于数百万个存储库中
  • 如果有办法用任何脚本或代码扫描Word目录 请给我一个指南

    非常感谢您的快速帮助(提前!)


    阿披实

    欢迎来到StackOverflow

    您最好的选择是使用查找您感兴趣的代码。例如,使用Github对我的域名进行搜索(而不是通过API),我能够

    但是,请记住,这并不能解决确保没有人复制您的源代码的问题。git服务数不胜数:GitHub、GitLab、Bitbucket等等。除此之外,您还必须与无法进行搜索的私有存储库进行斗争。搜索一切是不可能的。您的最佳选择是配备安全防护装置,以防止其发生,例如严格的访问控制,确保您的员工以及与您合作的任何供应商了解并同意公司有关数据的政策

    最后,有一个好的负责任的披露计划将鼓励白帽黑客通知您任何违规行为

    现在,考虑到所有这些,我仍然认为创建一个小机器人来搜索像github这样的热门地方不是一个坏主意。你可以做的另一件事是创建一个金丝雀,在那里你有一个唯一的任务是被唯一识别的对象,这样如果有漏洞,你的搜索可以很容易地找到它


    金丝雀可以是数据库中唯一的一行,也可以是包含唯一文本的特定文件,等等。您可以定期搜索该文本,如果它出现,您就知道有漏洞。

    欢迎使用StackOverflow

    您最好的选择是使用查找您感兴趣的代码。例如,使用Github对我的域名进行搜索(而不是通过API),我能够

    但是,请记住,这并不能解决确保没有人复制您的源代码的问题。git服务数不胜数:GitHub、GitLab、Bitbucket等等。除此之外,您还必须与无法进行搜索的私有存储库进行斗争。搜索一切是不可能的。您的最佳选择是配备安全防护装置,以防止其发生,例如严格的访问控制,确保您的员工以及与您合作的任何供应商了解并同意公司有关数据的政策

    最后,有一个好的负责任的披露计划将鼓励白帽黑客通知您任何违规行为

    现在,考虑到所有这些,我仍然认为创建一个小机器人来搜索像github这样的热门地方不是一个坏主意。你可以做的另一件事是创建一个金丝雀,在那里你有一个唯一的任务是被唯一识别的对象,这样如果有漏洞,你的搜索可以很容易地找到它


    金丝雀可以是数据库中唯一的一行,也可以是包含唯一文本的特定文件,等等。您可以定期搜索该文本,如果它出现,您就知道有漏洞。

    感谢您的及时回复!感谢您的及时回复!