Git Repo代码贡献量分析脚本 (Git Repository Contribution Mining)

代码贡献量 != 项目真实贡献
可是能不能从无意思但真实的数据中, 去挖掘一些有趣有用的信息, i.e., 用程序, 代替人去评估程序员.

比如:

  • insertion/deletion
  • 某个人写的代码被删的概率.
  • 等等

(如果你想到好的指标或算法, 请直接留言issue, 谢谢!)



Features:

  1. 快 (2500个commits的项目用时, 用时1.1s, 和gitinspector相比快了20倍.)
  2. 统计一个用户所有的commits, insertion, deletion, 改动总比重.
  3. 合并多个用户(不同用户名)—> 同一个用户名.
  4. 支持按列排序.


使用方法:

  • 安装python依赖:
1
2
git clone git@github.com:daya0576/git-code-contribution-analysis.git; cd git-code-contribution-analysis
pip3 install -r requirements.txt 
  • 配置:(可选)
    env.py中配置选项, e.g. 排序的列, 合并重复的author, ..
  • 运行:
1
python3 main.py <REPO PATH>


TODO

  1. 导出其他格式: html, cvs, excel, json
  2. 多个repo, 合并分析
  3. 兼容Python2
  4. 其他指标, 算法, 更好地分析项目贡献, 而不仅仅是代码量的贡献.
  5. 程序的进度条
  6. 将配置(env.py)放到参数中
  7. git log 中limitation能做到的都能加上, e.g. 时间范围等等
  8. 打包为一个package

Comments(需翻墙)

-->