Python 从Github存储库提取许可证信息
我正在尝试从github存储库中提取许可证信息。如果许可证允许使用回购协议,那么我会将其删除。是否已有任何用于此的API?如果没有,我正在寻找任何出发点或想法Python 从Github存储库提取许可证信息,python,github,web-scraping,github-api,licensing,Python,Github,Web Scraping,Github Api,Licensing,我正在尝试从github存储库中提取许可证信息。如果许可证允许使用回购协议,那么我会将其删除。是否已有任何用于此的API?如果没有,我正在寻找任何出发点或想法 我还考虑使用python刮板查找许可证文件以检索信息,但不确定许可证文件是否始终具有相同的名称,或者许可证信息是否始终存在于单独的许可证文件中。您可以从官方许可证文件开始 Licenses API返回有关流行开源许可证的元数据以及有关特定项目许可证文件的信息 许可证API使用尝试标识项目的许可证。被许可方将项目的许可证文件(如果存在)的内
我还考虑使用python刮板查找许可证文件以检索信息,但不确定许可证文件是否始终具有相同的名称,或者许可证信息是否始终存在于单独的许可证文件中。您可以从官方许可证文件开始 Licenses API返回有关流行开源许可证的元数据以及有关特定项目许可证文件的信息 许可证API使用尝试标识项目的许可证。被许可方将项目的
许可证
文件(如果存在)的内容与已知许可证的简短列表相匹配
因此,API不考虑项目依赖项的许可证,也不考虑记录项目许可证的其他方式,如文档中对许可证名称的引用
这就是我想要的。谢谢