将GitHub提交数据导入电子表格文件
我需要在电子表格文件中下载一个开源项目的提交数据。有没有办法将提交数据(将GitHub提交数据导入电子表格文件,git,github,spreadsheet,commit,feature-extraction,Git,Github,Spreadsheet,Commit,Feature Extraction,我需要在电子表格文件中下载一个开源项目的提交数据。有没有办法将提交数据(commit ID,文件更改,#LOC addition,#LOC deletation)从GitHub提取到电子表格?如果您在任何地方克隆了repo,下面的git命令将提供有关提交、作者姓名/日期和提交统计摘要的信息。您可以运行该命令并将输出存储在CSV文件中 git log --since='last month' --pretty=format:'%h;%an;%ad;%s' --numstat > summar
commit ID
,文件更改
,#LOC addition
,#LOC deletation
)从GitHub提取到电子表格?如果您在任何地方克隆了repo,下面的git命令将提供有关提交、作者姓名/日期和提交统计摘要的信息。您可以运行该命令并将输出存储在CSV文件中
git log --since='last month' --pretty=format:'%h;%an;%ad;%s' --numstat > summary.csv
输出应该类似于:
69bbf3e;Firstname Last name;Tue Aug 29 11:21:19 2017 -0400;Commit headline
2 0 dir-a/file-a
文件路径前的数字表示文件的添加和删除次数我确实克隆了repo,并将其保存在文件夹中;然后运行该命令,它会显示以下消息[致命:不是git存储库(或任何父目录):.git]将目录更改为文件夹后是否运行该命令?错误表明您没有从git repoi的顶部文件夹运行命令,我解决了这个问题。但是提取的数据仅包括(提交ID、作者、日期和摘要)如何获得每次提交的代码添加和删除次数??使用
--numstat
您应该获得每次提交更改的文件列表,以及添加和删除次数(见上面的修订答案)我使用了该命令;它成功提取提交日志并将其保存在csv文件中。但唯一需要关注的是,日志的格式无助于自动查找特定值(如添加的数量)。有没有办法使日志在行和列中结构良好?