change structure file name
Pull-based开发模式作为群体化软件开发模式的代表,是开源社群群智激发汇聚行为的集中体现。 其中PR审阅质量以及PR审阅效率的评估是被广泛关注的领域,涌现出了大量关于影响PR审阅质量和效率的相关因素研究,涉及的因素涵盖了从PR创建到PR审阅再到PR最终合并的整个生命周期,包括了PR创建者、PR审阅者、PR合并者等多方利益相关者。本项目聚焦大规模开源社群基于PR的开放协作,构建了相关研究领域规模最大、覆盖因素最全的PR合并质量与效率评估数据集。该数据集涵盖6种开发语言,1万+项目,3百万+ Pull Request,90+相关因素。
该数据集产生于如下文章: On the shoulders of giants: A new dataset for pull-based development research Pull request decisions explained: An empirical overview Pull request latency explained: an empirical overview
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
PR合并质量与效率评估行为开放数据集
Pull-based开发模式作为群体化软件开发模式的代表,是开源社群群智激发汇聚行为的集中体现。 其中PR审阅质量以及PR审阅效率的评估是被广泛关注的领域,涌现出了大量关于影响PR审阅质量和效率的相关因素研究,涉及的因素涵盖了从PR创建到PR审阅再到PR最终合并的整个生命周期,包括了PR创建者、PR审阅者、PR合并者等多方利益相关者。本项目聚焦大规模开源社群基于PR的开放协作,构建了相关研究领域规模最大、覆盖因素最全的PR合并质量与效率评估数据集。该数据集涵盖6种开发语言,1万+项目,3百万+ Pull Request,90+相关因素。
各字段含义如下
每一行对应一条pull request记录