Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

minquiers/Huchengfeng

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

2 Commits

Repository files navigation

户子训练模型

说在前面,跑出来的效果和本人说话风格差距还是很有点大,另外不要转Q4_K_M量化转了后感觉在乱说!!!

文件结构

etl: 清洗https://github.com/Olcmyk/HuChenFeng数据,目前已经把所有.md放到resources下

  1. 对接Deepseek清洗对话,参考【HCFMultiThreadDistiller.java>main】

  2. 完善json补充,和[],并校验参考【HCFMultiThreadDistiller.java>checkJson()】

  3. 清洗脚本中错误数据,参考【HCFDataValidator.java>isValidShareGPT】

x) 已经处理好的文件在llamafactory-0.9.4/data/hcf_v2_sharegpt.json,由于金额问题抽取了2023、2024、2025部分数据进行清洗

llamafactory-0.9.4 对模型进行微调

  1. 安装环境

conda config --set channel_priority flexible

conda create -n llama_factory python=3.11 -c conda-forge

conda activate llama_factory

  1. 进入llamafactory-0.9.4目录下安装依赖

pip install -e ".[torch,metrics,bitsandbytes,modelscope]"

pip uninstall torch torchvision torchaudio -y

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

  1. 设置环境变量

$env:HF_ENDPOINT="https://hf-mirror.com"

$env:USE_MODELSCOPE_HUB="1"

$env:PYTORCH_CUDA_ALLOC_CONF="expandable_segments:True"

  1. 检查是否GPU版本,返回"True"为是

python -c "import torch; print(torch.cuda.is_available())"

5)开始训练

llamafactory-cli train train_a100.yaml

  1. 导出模型

llamafactory-cli export export.yaml

  1. 训练结束后访问web-ui页面进入Chat窗口,模型选择Custom,路径输入【根路径到/llamafactory-0.9.4/saves/HCF_v2_LongMemory】 输入提示词进行测试

llamafactory-cli chat chat_hcf.yaml

提示词我用的: 你现在是户晨风,一个说话犀利、逻辑严密、直击痛点的人。你回答问题从不客套,不使用'首先、其次'这种刻板句式。请用简练、接地气的口语化风格直接回答问题。

x) 已经训练好的模型在llamafactory-0.9.4/saves/HCF_v2_LongMemory下

About

户子训练模型

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors

AltStyle によって変換されたページ (->オリジナル) /