add video url
本项目是用于训练mirau和标注,处理数据的工具。
1.finetune.sh
微调使用的脚本,基于ms-swift的微调脚本,微调的模型为qwen1.5-14b-chat
2.rlhf_label_tool.html
数据标注工具,效果如下图所示。 这是一个单页面的html文件,直接打开即可使用。文件里面需要填入user和bot的api接口地址和相应的apikey还有model type。确保都是统一的openai接口,如果你遇到了跨域的问题,请运行reverse_proxy.py,使用反向代理。
api接口地址
apikey
model type
reverse_proxy.py
3.label2sft
将标注好的数据转化为sft格式,使用方法: 填写代码中的”input_dir”和”out_put_jsonl”
python label2sft.py
运行即可。
一个基于qwen1.5-14b的有个性的大语言模型
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
2024年9月29日更新:
Mirau 一个有个性的语言模型
本项目是用于训练mirau和标注,处理数据的工具。
文件介绍及使用
1.finetune.sh
2.rlhf_label_tool.html
3.label2sft
运行即可。