GitHub - minquiers/Huchengfeng: 户子训练模型

Name	Name	Last commit message	Last commit date
Latest commit History 2 Commits
etl	etl
llamafactory-0.9.4	llamafactory-0.9.4
tmp	tmp
README.md	README.md

Name

Last commit message

Last commit date

Latest commit

History

2 Commits

etl

llamafactory-0.9.4

tmp

README.md

户子训练模型

说在前面,跑出来的效果和本人说话风格差距还是很有点大,另外不要转Q4_K_M量化转了后感觉在乱说!!!

文件结构

etl: 清洗https://github.com/Olcmyk/HuChenFeng数据,目前已经把所有.md放到resources下

对接Deepseek清洗对话,参考【HCFMultiThreadDistiller.java>main】
完善json补充,和[],并校验参考【HCFMultiThreadDistiller.java>checkJson()】
清洗脚本中错误数据,参考【HCFDataValidator.java>isValidShareGPT】

x) 已经处理好的文件在llamafactory-0.9.4/data/hcf_v2_sharegpt.json,由于金额问题抽取了2023、2024、2025部分数据进行清洗

llamafactory-0.9.4 对模型进行微调

安装环境

conda config --set channel_priority flexible

conda create -n llama_factory python=3.11 -c conda-forge

conda activate llama_factory

进入llamafactory-0.9.4目录下安装依赖

pip install -e ".[torch,metrics,bitsandbytes,modelscope]"

pip uninstall torch torchvision torchaudio -y

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

设置环境变量

$env:HF_ENDPOINT="https://hf-mirror.com"

$env:USE_MODELSCOPE_HUB="1"

$env:PYTORCH_CUDA_ALLOC_CONF="expandable_segments:True"

检查是否GPU版本,返回"True"为是

python -c "import torch; print(torch.cuda.is_available())"

5)开始训练

llamafactory-cli train train_a100.yaml

导出模型

llamafactory-cli export export.yaml

训练结束后访问web-ui页面进入Chat窗口,模型选择Custom,路径输入【根路径到/llamafactory-0.9.4/saves/HCF_v2_LongMemory】输入提示词进行测试

llamafactory-cli chat chat_hcf.yaml

提示词我用的: 你现在是户晨风,一个说话犀利、逻辑严密、直击痛点的人。你回答问题从不客套,不使用'首先、其次'这种刻板句式。请用简练、接地气的口语化风格直接回答问题。

x) 已经训练好的模型在llamafactory-0.9.4/saves/HCF_v2_LongMemory下

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

minquiers/Huchengfeng

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages