目录
目录README.md

社群行为数据集

本仓库是一个针对拉取请求(pull request)的开发者编程行为数据集。数据集基于开源社区GitHub构建,包括3种与拉取请求相关的行为数据(创建create,评审review,评论comment),涵盖用户超过1万名。


1. create.csv

该文件包含了拉取请求的创建行为,数据格式示例如下:

repo_name PR_number creator merged merged_time closed_time
akka/akka 23202 patriknw TRUE 2017-06-19T15:17:47Z 2017-06-19T15:17:47Z
akka/akka 23180 ktoso FALSE None 2017-06-17T05:54:24Z

2. review.csv

该文件包含了拉取请求的评审行为,数据格式示例如下:

repo_name PR_number reviewer merged merged_time closed_time
akka/akka 23202 ktoso TRUE 2017-06-19T15:17:47Z 2017-06-19T15:17:47Z
akka/akka 23180 ktoso FALSE None 2017-06-17T05:54:24Z

3. comment.csv

该文件包含了拉取请求的评论行为,数据格式示例如下:

repo_name PR_number commenter comment_times
akka/akka 23170 richardimaoka 2

注意:

  • create.csv和review.csv中的merged_time字段表示拉取请求被合并的时间。若拉取请求未被合并,则merged_time字段为None,如#23180。
  • review.csv中的数据包括拉取请求创建者自我评审的情况,如#23180,其创建者和评审者均为ktoso。
关于

SocialBehavior_Dataset

10.1 MB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号