目录
目录README.md

2024年9月29日更新:

  • 新增agent能力:能够感知用户的位置信息,来获取天气等环境信息,代码在创空间
  • 主动感知环境:能够主动结合环境信息,给用户回复
  • 将基础模型替换为qwen2.5-14b-instruct
  • 演示视频demo

Mirau 一个有个性的语言模型

本项目是用于训练mirau和标注,处理数据的工具。

文件介绍及使用

1.finetune.sh

微调使用的脚本,基于ms-swift的微调脚本,微调的模型为qwen1.5-14b-chat

2.rlhf_label_tool.html

数据标注工具,效果如下图所示。标注工具界面 这是一个单页面的html文件,直接打开即可使用。文件里面需要填入user和bot的api接口地址和相应的apikey还有model type。确保都是统一的openai接口,如果你遇到了跨域的问题,请运行reverse_proxy.py,使用反向代理。

3.label2sft

将标注好的数据转化为sft格式,使用方法: 填写代码中的”input_dir”和”out_put_jsonl”

python label2sft.py 

运行即可。

关于

一个基于qwen1.5-14b的有个性的大语言模型

61.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号