目录
目录README.md

关于数据集

Dockerfile在基于Docker的容器化过程中发挥着重要作用,但实际上许多Dockerfile代码都充满了Smells。 该数据集包含6334个项目的集合,以帮助开发人员深入了解Dockerfile气味的发生。 这些项目属于10种流行的编程语言,即Shell,Makefile,Ruby,PHP,Python,Java,HTML,CSS,JavaScript和Go。

数据集概述

该数据集包含6334个项目,包括它们的元数据(即名称,所有者类型,创建时间,编程语言,星号和贡献者数量),以及Dockerfile气味的详细信息(即指令数量,总体气味数量, DL气味的数量和SC气味的数量)。

数据指标概述

具体来说,数据集中的指标是: project:项目名称; p_language:项目的编程语言; p_contributors_team:项目贡献者的数量(至少提交一次); p_created_at:项目的创建日期; p_owner_type:项目所有者的类型,即“组织”或“用户”; p_stars:项目星数; p_github_age:自从项目在GitHub上托管到2018年4月已经过去的天数; d_instructions:Dockerfile中的指令数; d_smells:Dockerfile中所有气味的数量; d_smells_dl:Dockerfile中的DL-smells的卷数; d_smells_sc:Dockerfile中SC气味的数量。

数据集关联论文

@article{wu2020characterizing,
  title={Characterizing the Occurrence of Dockerfile Smells in Open-Source Software: An Empirical Study},
  author={Wu, Yiwen and Zhang, Yang and Wang, Tao and Wang, Huaimin},
  journal={IEEE Access},
  volume={8},
  pages={34127--34139},
  year={2020},
  publisher={IEEE}
}

引用此数据集

@data{r9v8-4f07-19,
doi = {10.21227/r9v8-4f07},
url = {https://dx.doi.org/10.21227/r9v8-4f07},
author = {Yiwen Wu; Yang Zhang; Tao Wang; Huaimin Wang },
publisher = {IEEE Dataport},
title = {Dataset for Characterizing the Occurrence of Dockerfile Smells in Open-Source Software},
year = {2019} }
关于

本数据集涵盖10种编程语言,6334个开发项目的容器配置数据

226.0 KB
邀请码