一、项目说明:
自动检测软件需求文档缺陷,文本文件在线编辑和管理。
二、预处理:
使用jieba对文本分词后,构建词典,通过Embedding Layer和Word2Vec预处理生成词向量。
三、模型:
基于BERT预训练模型迁移学习的文本分类模型+TensorFlow-Keras,加入样本对抗训练。
四、数据集:
需求文本数据集中共有超过一万条精准分类的数据,涵盖正确需求、模糊需求、不可验证需求、不完整需求样本。
五、模型效果:
在验证集上的准确率达到93%左右,高于混合CNN-RNN模型、attention机制GRU分类模型。
六、主要功能:
文件管理、缺陷检测、问题分类、文本定位、文件编辑、缺陷报告生成、文件导入导出、用户信息管理。
七、后续工作:
优化文本编辑功能,继续丰富数据集,调参及优化模型,提高准确率,集成到快易需求系统。
一、项目说明: 自动检测软件需求文档缺陷,文本文件在线编辑和管理。 二、预处理: 使用jieba对文本分词后,构建词典,通过Embedding Layer和Word2Vec预处理生成词向量。 三、模型: 基于BERT预训练模型迁移学习的文本分类模型+TensorFlow-Keras,加入样本对抗训练。 四、数据集: 需求文本数据集中共有超过一万条精准分类的数据,涵盖正确需求、模糊需求、不可验证需求、不完整需求样本。 五、模型效果: 在验证集上的准确率达到93%左右,高于混合CNN-RNN模型、attention机制GRU分类模型。 六、主要功能: 文件管理、缺陷检测、问题分类、文本定位、文件编辑、缺陷报告生成、文件导入导出、用户信息管理。 七、后续工作: 优化文本编辑功能,继续丰富数据集,调参及优化模型,提高准确率,集成到快易需求系统。